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Essentielle Gene und Genprodukte zur Identifizierung, Entwicklung und 
Optimierung von immunologischen und pharmakologischen Wirkstoffen zur 
Behandlung mikrobieller Infektionen 



Essentielle G n und Genpr dukte zur Identifizierung, Entwicklung und 
Optimierung von immunologischen und pharmakologischen Wirkstoffen zur 
Behandlung mikrobieller Infektionen 

Beschreibung 

Die vorliegende Erfindung betrifft ein Verfahren zur Identifizierung und 
Charakterisierung essentieller Gene von pathogenen Mikroorganismen, deren 
Verwendung zurn Auffinden neuer immunologischer und pharmakologischer 
Wirkstoffe zur Prophylaxe, Therapie und Diagnose bakterieller Infektionen, 
sowie die Weiterentwicklung und Optimierung dieser Wirkstoffe. Von der 
Erfindung eingeschlossen sind die entsprechenden Nukleinsauren, welche 
fur die essentiellen Genprodukte kodieren, und die davon kodierten 
Polypeptide. AufSerdem betrifft die Erfindung Vektoren, die die 
erfindungsgernafcen Nukleinsauren enthalten, mit diesen Vektoren 
transformierte Zellen und fur die Polypeptide spezifische Antikorper. Diese 
Nukleinsauren und Polypeptide konnen zur Diagnose, Prevention und 
Behandlung von mikrobiellen Infektionen eingesetzt werden, insbesondere 
konnen sie zur Entwicklung von Antikdrpern, Impfstoffen und Inhibitoren 
verwendet werden. 

Die vollstandige molekulare ErschlieBung des Genoms des Menschen und 
klinisch relevanter Pathogene offnet neue Wege in der Entwicklung von 
Therapeutika bzw. Prophylaktika gegen die Krankheiten des Menschen. So 
ist die Entschlusselung des menschlichen Genoms fur die nachsten Jahren 
angekiindigt. Die Anzahl molekular vollstandig charakterisierter pathogener 
Keime nimmt standig zu. Das erklarte Ziel ist es nun, aus dem 
umfangreichen Datenmaterial solche Gene zu identifizieren, deren Produkte 
als potentielles Ziel fur einen Wirkstoff in Frage kommen und somit fur die 
Entwicklung eines spezifischen Wirkstoffs benutzt werden konnen. Dieses 



Potential laSt sich aus der Primarstruktur eines Gens nicht ableiten, sondern 
muB experimentell bestimmt werden. 

Liegt die komplette genomische Sequenz eines Organismus vor, steht man 
vor dem Problem, die enorme Datenmenge fur weiterfuhrende biologische 
Analysen zuganglich zu machen. Der erste Schritt ist die Identifizierung 
aller auf dem Genom liegenden Gene. Dies geschieht in der Regel mit Hilfe 
computergestiitzter Suchpfogramme, die mit einer gewissen Sicherheit 
potentielle Gene vorhersagen konnen. Auf diese Weise konnen Genkarten 
erstellt werden, die allerdings noch mit einer groSen Ungenauigkeit behaftet 
sind. Konnen die vom Suchprogramm ausgewiesenen Gene keinem 
bekannten Gen zugeordnet werden, muS die Funktionalitat dieser 
hypothetischen Gene durch den physikalischen Nachweis der Genprodukte 
in der ursprunglichen Zelle nachgewiesen werden. 

Eine andere Strategie, die ebenfalls auf der Anwendung spezieller 
Suchprogramrne beruht, ist auf die Identifizierung moglicher Genfamilien 
ausgerichtet, die mit speziellen biologischen Eigenschaften verknupft sind, 
die wiederum aufgrund weiterer Annahmen als Wirkstoffziel in Betracht 
kommen. Die Suchkriterien sind auf charakteristische Strukturmerkmale 
ausgerichtet, die in der Regel von schon bekannten Genen abgeleitet 
wurden. Das Ergebnis einer solchen Suche kann, in Abhangigkeit von der 
Annaherung der Vorgaben zum wirklichen Zustand, eine hohe Trefferquote 
liefern. In der Regel ist die Ungenauigkeit dieser Verfahren jedoch relativ 
hoch, und die wirkliche biologische Eigenschaft des Gens bzw. dessen 
Genprodukts muG auf jeden Fall experimentell bestatigt werden. 

Eine weitere Strategie erfafSt die Expressionsprodukte einer Zelle, wodurch 
die zum jeweiligen Entwicklungszustand aktiven Gene identifiziert werden 
konnen. Vergleicht man verschiedene Entwicklungszustande miteinander, 
kann auf diese Weise das Zusammenwirken der Gene abgeleitet werden und 
in einigen Fallen kann die biologische Funktion unbekannter Gene teilweise 
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entschlusselt werden. Fuhrt man entsprechende Vergleichsuntersuchungen 
mit Zellen durch, die ein pathologisches Erscheinungsbild haben, ist es 
sogar moglich auch krankheitsverursachende Gene zu identifizieren und 
diese als potentielle Wirkstoffziele f Or die Wirkstof f entwicklung einzusetzen . 

Alle beschriebenen Verfahren dienen insbesondere dazu^ bislang unbekannte 
Gene zu identifizieren und diesen mit Hilfe Computer-gestiitzter 
Datenvergleiche eine biologische Funktion zuzuordnen. Eine eindeutige 
Bewertung eines Gens bzw. Genprodukts hinsichtlich seines Potentials als 
Wirkstoffziel zu dienen und somit fur die Entwicklung von Wirkstoffen 
herangezogen werden zu konnen, erfullt jedoch keines der bekannten 
Verfahren. 

Einige der wichtigsten Voraussetzungen fur einen pathogenen Organismus, 
in einem Wirt zu uberleben und sich zu vermehren, sind einerseits die 
Fahigkeit, dem Immunsystem des Wirts zu entgehen, und andererseits die 
Fahigkeit zur Anpassung an einen ganz speziellen Lebensraum oder Nische. 
Die dafur verantwortlichen Faktoren und Proteine sind somit in der Regel 
essentiell fur den pathogenen Keim. 

Es ware von groRem Vorteil, diese essentiellen Gene von Mikroorganismen 
zu identifizieren, urn auf diese Weise die Moglichkeit zur Herstellung von 
therapeutischen, praventiven oder/und diagnostischen Mitteln, z.B. 
Antikorpern, Impfstoffen oder Inhibitoren der entsprechenden Polypeptide 
zu bekommen. 

Ein Pathogen von besonderem medizinischen Interesse ist Helicobacter 
pylori. Dieser Keim ist ein Gram-negatives, spiralformiges Bakterium mit 
hohem pathogenen Potential, das in den letzten Jahren verstarkt 
Resistenzen gegen eine Reihe therapeutisch relevanter Antibiotika 
entwickelt hat und somit von grolSer klinischer Bedeutung ist. Es zeichnet 
sich durch extrem hohe Beweglichkeit aufgrund seiner Flagellen und der 



ungewdhnlichen Fahigkeit, im stark sauren Milieu (bis pH 1,5) des Magens 
uberleben zu konnen, aus (Goodwin et al., 1989). 

Obgleich das Auftreten von spiralformigen Bakterien in der menschlichen 
Magenschleimhaut seit langem bekannt ist, weiS man erst seit der 
erfolgreichen Isolierung und Kultivierung dieses Bakteriums (Warren and 
Marshall 1983; Marshall et al., 1984) aus der Magenschleimhaut eines 
Patienten mit einem Magengeschwur (Ulcus ventriculi), date es sich hierbei 
um pathogene Keime handelt. Die A/.py/o/v-Infektion zahlt zu den haufigsten 
chronischen bakteriellen Infektionen des Menschen. Sie tritt weltweit auf, 
wobei ca. 50% der Bevolkerung mit diesem Bakterium infiziert sind. 

Eine Infektion fuhrt zwangslaufig zur Auslosung einer bakteriellen Gastritis 
(Typ-B Gastritis) beim Menschen. Ferner geht man davon aus, daB H. pylori 
auch eine ursachliche Rolle bei der Entstehung von Magen- und 
Zwolffingerdarmgeschwuren (Ulcus ventriculi und Ulcus duodeni) sowie bei 
einigen Formen des Magenkarzinoms (Adenokarzinom) spielt (Lee et al., 
1 993; Solnick und Tompkins, 1 993). In zwei Studien von 1 991 wurde eine 
statistisch signifikante Korrelation zwischen der /■/.py/o/v-lnfektion und dem 
Auftreten des Magenkarzinoms (intestinaler Typ) gezeigt, wobei beide 
Studien zu dem SchluB kamen, daB ca. 60% aller auftretenden 
Magenkarzinome wahrscheinlich auf eine Mpy/o/v-lnfektion zuruckzufiihren 
sind (Parsonnet et al., 1991; Nomura et al., 1991). Auch die seltener 
auftretenden MALT (Mucosa Associated Lymphoid Tissue) Lymphome des 
Magens, die als Vorstufen von B-Zell-Tumoren des Immunsystems 
angesehen werden, sind vermutlich eine Folge der Mpy/or/-lnfektion. Eine 
Folge der Langzeitinfektion mit H. pylori ist die atrophische Gastritis, eine 
Degeneration der Schleim, Saure oder Pepsin produzierenden Zellen des 
Magenepithels, die als eine prakanzerose Lasion angesehen werden muB. 

Nach der oralen Aufnahme gelangen die Bakterien zunachst in das extrem 
saure Magenlumen (pH 1 bis 2). Dort wird durch die Produktion des Enzyms 



Urease, das zur Spaltung des vorhandenen Harnstoffs und damit zur lokalen 
Neutralisierung des sauren pH-Wertes im Magen fuhrt, was das Uberleben 
der Bakterien ermoglicht. Mittels chemotaktischer Orientierung und 
flagellenabhangiger Motilitat bewegen sich die Keime dann in die 
Bicarbonat-gepufferteSchleimschichtder Antrum-Region des Magens, ihren 
eigentlichen naturlichen Habitat. Dort befinden sie sich in einer einzigartigen 
okologischen Nische, die aufgrund der Saurebarriere nur fur wenige 
konkurrierende Bakterienarten zuganglich ist. Vermutlich orientieren sich die 
Bakterien an den pH-Gradienten zwischen Lumen (pH 1-2) und 
Epithelzelloberflache (pH 6-7), um zum Epithel zu gelangen. Durch ihre 
spiralige Form, ihre Beweglichkeit im viskosen Schleim, die Produktion von 
Mukus-modifizierenden Enzymen und schlieSlich durch eine mikroaerophile 
Lebensweise sind diese Keime optimal an die Lebensbedingungen in diesem 
Habitat angepafct. Sie halten sich meist in den tiefen Krypten der Antrum- 
Region auf, wo sie vor auSeren Einflussen wie z.B. Saure, Pepsin aber auch 
vor Medikamenten zu ihrer Eradikation, wie z.B. Antibiotika, geschutzt sind. 
Ein Teil der Bakterienpopulation (ca. 20%) ist eng mit Epithelzellen 
assoziiert, vor allem mit Schleim produzierenden Zellen. Unter der 
Voraussetzung einer gastralen Metaplasie, d.h. der saureinduzierten 
Ausbildung von gastralem Epithel im Duodenum, kommt es auch zur 
Kolonisierung metaplastischer Areale im Zwolffingerdarm, wodurch die 
Voraussetzungen zur Entstehung des Zwolffingerdarmgeschwurs (Ulcus 
duodeni) geschaffen sind. Durch ihre Fahigkeit zur Adharenz wird vermutlich 
eine komplette Ausscheidung der Helicobacter mit dem abgestoSenen 
Schleim verhindert, so da(S die Bakterien fur Jahre, Jahrzehnte oder gar 
lebenslang persistieren konnen (chronische Infektion). 

Bevor die Existenz und die Bedeutung des H. pylori fur die 
Ulkuserkrankungen bekannt waren, wurden diese durch sog. Antazida, oder 
H 2 -Rezeptorantagonisten behandelt. Dabei handelt es sich um Substanzen, 
welche die Sauresekretion der Magenparietalzelle inhibieren. Unter dem 
EinfluS dieser Arzneimfttel kommt es zwar zumeist zur Abheilung von 



Geschwuren, da j doch eine der Ursachen dieser Geschwure, namlich die 
//.py/o/v-lnfektion, damit nicht eliminiert wird, kommt es in den meisten 
Fallen nach kurzerZeit zu einem erneuten Auftreten der Ulzeration (Rezidiv). 

Eine weitere, haufig bei Ulzerationen angewandte Therapie ist die Wismut- 
Behandlung. Verschiedene Wismut-Salze (CBS, BSS) haben einen 
bakteriziden Effekt auf H. pylori. Ein bedeutender Nachteil dieser 
Therapieform ist jedoch, daB eine totale Eradikation des Keims nur in einem 
sehr geringen Prozentsatz der Falle erreicht wird (8 bis 32%). Wie bei der 
Behandlung mit Antazida kommt es nur zu einer vorubergehenden 
Suppression des Keims, und nach Absetzen der Behandlung erfolgt in den 
meisten Fallen wieder ein Aufflackern der Infektion. Ein weiterer Nachteil 
der Wismut-Behandlung ist, date eine langer dauerende Therapie mit hohen 
Dosen zu einer Akkumulation dieser Substanz in der Leber, Niere und dem 
Nervensystem fuhrt und betrachtliche neurologische Nebenwirkungen hat 
(Malfertheiner, 1994). 

Seit der Erkenntnis, date es sich bei den gastroduodenalen 
Ulkuserkrankungen um Infektionskrankheiten handelt, werden zur 
Behandlung nun auch Antibiotika eingesetzt. Die Monotherapie mit 
verschiedenen Antibiotika (Amoxicillin, Nitrofuran, Furazolidin, Erythromycin 
und dergleichen) stellte sich jedoch als nicht zufriedenstellend heraus, da es 
auch hier nur bei 0 bis 15 % der Zellen zur kompletten Eradikation der 
Keime kommt. Die bisher erfolgreichste Behandlung wird zur Zeit durch eine 
Kombination eines Saureblockers (Ompeprazol) mit einem Antibiotikum 
(Amoxicillin) erreicht, die zu Eradikationsraten bis zu 80% fuhren kann 
(Malfertheiner, 1994). Auf die Dauer ist eine Antibiotikabehandlung zur 
Eliminierung von H. pylori jedoch nicht erfolgversprechend, da aufgrund der 
unvollstandigen Eradikation des Keims mit einer raschen Resistenz- 
entwicklung der Bakterien gegen Antibiotika gerechnet werden muS. 



Das zunehmende Auftreten von Antibiotika-Resistenzen und die 
eingeschrankten Behandlungsoptionen, die in der Regel betrachtliche 
unerwunschte Nebenwirkungen haben, macht das Auffinden neuer 
Therapieformen und dabei insbesondere die Identifizierung neuer Wirkstoffe 
notwendig, vor allem Impfstoffe, die sowohl zur prophylaktischen, als auch 
therapeutischen Behandlung von He/icobacter-\nfekt'\onen verwendet 
werden konnen. Von besonderem Interesse ist auch die Darreichungsform, 
da der Wirkstoff im Magen, d. h. in einem extrem sauren Milieu wirksam 
sein muB. Verbindungen mit Protonenblockern, die z. B. vor der 
Verabreichung des prophylaktischen oder therapeutischen Wirkstoffs 
gegeben werden, konnen hierbei von groRem Nutzen sein. 

Die molekulare Grundlage fur persistierende, chronische Helicobacter- 
Infektionen ist bislang noch nicht geklart. Es konnte gezeigt werden, date 
die Faktoren Urease, Beweglichkeit und Adharenz essentielle Eigenschaften 
des Bakteriums sind, die gastrische Mukosa kolonisieren zu konnen. 
Obgleich der Wirtsorganismus unter normalen Bedingungen nicht in der Lage 
ist, mit einer Mp//or/-lnfektion fertig zu werden, zeigte sich im Tiermodell, 
date die Urease, ein essentieller Virulenzfaktor von H. pylori, ein hohes 
Potential als Vakzin besitzt (US-Patentanmeldung US-SN-07/970,006 
"Urease-based Vaccine Against Helicobacter Infection). 

Diejenigen Komponenten jedoch, die dafur verantwortlich sind, dafc das 
Pathogen das Immunsystem des Wirtes umgehen kann, sind bisher noch 
unbekannt. 

Pathogene Organismen im Allgemeinen haben eine Vielzahl von Strategien 
entwickelt, im Wirt uber einen langen Zeitraum vom Immunsystem 
unbehelligt persistieren zu konnen (Haas und Gobel, 1992; Finlay und 
Falkow, 1 997). Ein Mechanismus, der zum Uberleben in lebensfeindlichem 
Milieu dient, ist die Ausbildung einer Uberdauerungsform. 



Im Falle von H. pylori sind in der Literatur kokkoide Formen als potentielle 
Uberdauerungsformen mehrfach beschrieben, ihre klinische Bedeutung ist 
allerdings umstritten. Kokkoide Formen konnten fur eine ex vivo 
Uberdauerung eine grofce Rolle spielen. Hinsichtlich der in vivo 
Uberdauerung wurde gezeigt, da& kokkoide Formen bevorzugt durch ein 
ungiinstiges Milieu wie z. B. einen hohen 0 2 -Partialdruck oder subletale 
Gaben von Antibiotika (Wismut-Subcitrat, Erythromycin, Amoxicillin, 
Metronidazol) induziert werden (Donelli et al., 1998; Bode eta/., 1993; 
Sorberg eta/., 1996; Berry et a/., 1995). 

Einige Forscher gehen davon aus, daB diese kokkoiden Bakterien 
lebensfahig, aber nicht kultivierbar sind (VNC, viable but non-culturable). 
Eaton und Mitarbeiter erhielten eine erfolgreiche Infektion von Mini- 
Schweinchen mit vegetativen (spiraligen) H. pylori, wahrend kokkoide 
Formen in diesem Modell keine Infektion zeigten (Eaton eta/., 1995). Der 
direkte Nachweis von kokkoiden Formen im menschlichen Magen wurde von 
Chan et al. anhand von Magengewebeschnitten aus Biopsiematerial 
erbracht. In 82.8 % (53/64)der untersuchten Biopsieproben konnten die 
Autoren kokkoide Formen von H. pylori nachweisen (Chan et al, 1994). 
Von Cao et al. wurde ein monoklonaler Antikorper zum spezifischen 
Nachweis von kokkoiden H. pylori im Gewebeschnitt benutzt. Auch hier 
wurden neben den vegetativen Formen in 100 % der Antrumbiopsien (9/9) 
H. pylori kokkoide Formen nachgewiesen (Cao et al., 1997). 

Die Bindung an Epithelzellen und die Fahigkeit zur Signaltransduktion (IL-8- 
Induktion, Rearrangement des Zytoskeletts, Bindung von Plasminogen, 
Laktoferrin und Vitronectin auf der Bakterienoberflache) scheint bei 
kokkoiden Formen vergleichbar zu den vegetativen Formen erhalten zu sein 
(Khin eta/., 1996; Segal eta/., 1996). 

Die oben genannten Experimente deuten auf eine Bedeutung kokkoider 
Formen fur die Uberlebensfahigkeit von Helicobacter m ungunstigem Milieu 



hin. Daher ist die Identifizierung von Genen, die mit der Entstehung dieser 
Form und Reaktivierung in die vitale Form zusammenhangen, fur die 
Entwicklung neuer Wirkstoffe von groStem Interesse. 

Neben Helicobacter pylori konnen auch andere Helicobacter Spezies den 
Magen des Menschen kolonisieren wie z. B. H. heilmannii und H. felis. 
Diesbezuglich konnte gezeigt werden, daS auch H. heilmannii mit 
krankhaften Ulkuserkrankungen in Zusammenhang gebracht werden kann. 
Die ursachliche Ubertragung findet wahrscheinlich von Haustieren auf den 
Menschen statt. Bislang wurde der im Menschen haufig vorkommende 
H. pylori in den Verdacht gebracht, bei der Entstehung von Magenkrebs eine 
Rolle zu spielen. Mittlerweile gibt es klinische Daten, die diesen 
Zusammenhang anzweifeln. Besonders werden diese Zweifel durch neuere 
Daten von Helicobacter heilmannii unterstutzt, die diesem ein groSeres 
kanzerogenes Potential beimessen und dessen Bedeutung bei der 
Entstehung des gastrischen MALT Lymphoms hervorherben (Regimbeau et 
al., 1988). 

Wird das bisher Gesagte zusammenfassend betrachtet, ist es klar, daS ein 
Bedurfnis nach neuen Therapieformen fur die Bekampfung bakterieller 
Krankheitserreger, insbesondere nach Impfstoffen und Inhibitoren von 
essentiellen Genen bzw. deren Expressionsprodukten besteht. Die 
zunehmende Resistenzentwickung gegen eine Vielzahl bewahrter 
Medikamente erfordert eine kontinuierliche Versorgung mit neuen 
Wirkstoffen. Dieser steigende Bedarf an neuen Wirkstoffen kann nur 
gedeckt werden, wenn neue Wirkstoffziele identifiziert und diese zur 
Entwicklung neuer Wirkstoffe herangezogen werden. Essentielle Gene 
stellen fur die Wirkstoffentwicklung ein ideales Ziel dar, da sie fur das 
Uberleben des Krankheitserregers notwendig sind. 

Die Identifizierung essentieller Gene von Helicobacter, insbesondere von 
H. pylori bzw. heilmannii und von moglichen Helicobacter 
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Uberdauerungsformen zur Entwicklung und Optimierung neuer 
therapeutischer, praventiver und/oder diagnostischer Mittel, wie z. B. 
Impfstoffe und pharmakologischer Wirkstoffe stellt daher ein Ziel der 
Erfindung dar. Im Vordergrund steht das Auffinden essentieller mikrobieller 
Gene, wobei auch homologe Proteine verschiedener pathogener Keime 
identifiziert werden konnen. Mit Hilfe eines Wirkstoffs konnten dann wie bei 
den klassischen Antibiotika mehrere pathogene Keime gleichzeitig eliminiert 
werden. Bei Helicobacter stehen insbesondere Gene im Vordergrund, die 
lebensnotwendige Funktionen im Infektionsprozefoerfullen, sowie Gene, die 
an der Entwicklung und Reaktivierung von kokkoiden Formen beteiligt sind. 
Von besonderem Interesse sind hierbei essentielle Gene, die fur sekretierte 
Genprodukte kodieren, da diese fur immunologische und pharmakologische 
Wirkstoffe aufgrund ihrer exponierten Lokalisation besonders gut erreicht 
werden konnen und daher gute Kandidaten zur Wirkstoffentwicklung sind. 
Weiterhin von Interesse sind essentielle Gene, die fur Genprodukte kodieren, 
die an der Entwicklung und der Aufrechterhaltung von 
Uberdauerungsformen beteiligt sind. Eine weitere Aufgabe ist das Auffinden 
essentieller mikrobieller Gene, wobei auch homologe Proteine verschiedener 
pathogener Keime identifiziert werden konnen. Mit Hilfe eines Wirkstoffs 
konnten dann wie bei den klassischen Antibiotika mehrere pathogene Keime 
gleichzeitig eliminiert werden. 

Diese Aufgabe wird gelost durch ein Verfahren zur Bereitstellung von 
Mitteln zum Nachweis, zur Therapie oder/und zur Prevention von 
mikrobiellen Infektionen, das die folgenden Schritte umfaBt: 
(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendefizienter Mikroorganismen durch 
konditionale Antisense-Hemmung (CAI) oder/und subtraktive 
Rekombinations-Mutagenese (SRM) und Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen in einem 
Testsystem. 



(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung der 
Mikroorganismen oder verwendeter Mikroorganismen herbeifuhren. 

(C) Testen der identifizierten Wirkstoffe auf ihre Anwendbarkeit als 
Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

Das hier dargestellte Verfahren befaBt sich mit der Identifizierung 
essentieller Gene und deren Verwendung zur Entwicklung neuer Wirkstoffe. 

Ein weiterer Aspekt der vorliegenden Erfindung ist somit auch ein Verfahren 
zum Identifizieren von essentiellen mikrobiellen Genen, das die folgenden 
Schritte umfalSt: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i), 

(iii) Identifizieren eines proteinkodierenden Abschnitts einer mikrobiellen 
DNA-Sequenz, in der die gendefizienten Mikroorganismen defiziert 
sind und 

(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur die 
Uberlebensfahigkeit sind. 

CAI ist die Abkurzung fur conditional antisense inhibition", d.h. 
konditionale Antisensehemmung. Es handelt sich hierbei urn ein Verfahren, 
welches weiter unten naher beschrieben ist. 

SRM steht fur , # subtractive recombination mutagenesis 7 ', d.h. subtraktive 
Rekombinationsmutagenese und ist ebenfalls unten beschrieben. 
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Der Ausdruck "gendefizient", wie er hier verwendet wird, bedeutet, daB der 
defiziente Organismus nicht in der Lage ist, ein oder mehrere seiner 
Genprodukte herzustellen oder deren Funktion zu nutzen. Die Herstellung 
des entsprechenden Genprodukts kann einerseits durch Mutagenese des 
entsprechenden Gens verhindert werden, oder es kann eine Inhibition 
wahrend der Expression stattfinden, z.B. durch Antisensenukleinsauren. 
Eine Mutagenese kann dazu eingesetzt werden, ein Gen in dem Genom des 
Mikroorganismus zu mutieren, oder dazu, ein mutiertes Gen in den 
Mikroorganismus einzubrigen, wobei man sich auch die homologe 
Rekombination zunutze machen kann. 

Ein proteinkodierender Abschnitt einer Nukleinsauresequenz ist beispielweise 
ein Gen oder ein Teil eines Gens das/der die Expression eines Polypeptids 
erlaubt. 

Der Begriff "essentielles Gen" bedeutet ein Gen, das fur ein Genprodukt 
kodiert, ohne welches ein Organismus nicht uberlebensfahig ist oder nur 
beschrankt uberlebensfahig ist. Essentielle Gene konnen in zwei Klassen 
unterteilt werden: obligat essentielle und fakultativ essentielle Gene. Ein 
obligat essentielles Gen kodiert fur ein Protein, das fur das Uberleben oder 
die Vermehrung eines Organismus unter alien Umstanden unabdingbar ist. 
Demgegenuber kodiert ein fakultativ essentielles Gen fur ein Protein, das 
lediglich unter bestimmten Bedingungen fur das Uberleben oder die 
Vermehrung des Organismus notwendig ist, wie z.B. die Fahigkeit des 
Organismus, innerhalb von kultivierten Saugerzellen oder im Tier zu 
uberleben. In beiden Fallen wird das Uberleben oder die Vermehrung des 
Organismus durch die Inaktivierung eines fur ihn essentiellen Gens bzw. die 
Inhibierung eines fur ihn essentiellen Genproduktes stark beeintrachtigt bzw. 
verhindert. Ist ein Bakterium nach der Inaktivierung eines bestimmten Gens 
nicht mehr uberlebensfahig bzw. in der Vermehrung eingeschrankt, kann 
dies als erster Hinweis dafur gewertet werden, dafS durch dieses Gen 
essentielle Eigenschaften vermittelt werden. Die Aussagekraft solcher 
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Befunde muB jedoch durch begleitende Kontrollexperimente untermauert 
werden, z.B. sollte eine solche letale Mutation in einem zweiten Schritt 
durch eine entsprechende Komplementation des Gens bzw. Genprodukts 
aufgehoben werden konnen. Obligat essentielle Gene sind demnach solche, 
deren Nichtexpression oder Nichtvorhandensein, z.B. durch Mutagenese 
oder Deletion dazu fuhrt, daS der Organismus weder in natCirlicher 
Umgebung, noch auf einem ideal auf die Bedurfnisse des Mikroorganismus 
abgestimmten Vollmedium lebensfahig ist. 1st ein Mikroorganismus in einem 
fakultativ essentiellen Gen defizient, ist er in der Regel auf einem solchen 
je nach Organismus definierten Vollmedium noch wachstumsfahig, kann 
jedoch in natiirlicher Umgebung, d.h. in seinem naturlichen Wirt oder Zellen 
oder Gewebekulturen seines naturlichen Wirtes nicht mehr uberleben. 

Identifizieren von essentiellen Genen 

Durch das neue Verfahren konnen unabhangig von ihrer speziellen Funktion 
essentielle Gene von Mikroorganismen identifiziert werden. Bevorzugt wird 
dieses Verfahren zur Identif izierung von essentiellen Genen aus Helicobacter 
und verwandten Mikroorganismen eingesetzt. 

In einem ersten Teilschritt wird das komplette Genom eines bakteriellen 
Krankheitserregers mit einem molekulargenetischen Ansatz nach essentiellen 
Genen durchsucht. Dieser Teilschritt erfordert keinerlei Kenntnisse uber die 
Primarstruktur des Genoms bzw. individueller Gene, sondern erfolgt 
ausschlieSlich aufgrund biologischer Kriterien. Ist ein Gen als essentielle 
Determinante identifiziert, wird dessen Identitat ermittelt. Hierbei kann auf 
die ermittelten Rohsequenzdaten der genomischen Sequenzierungen 
zuruckgegriffen werden. Anhand der ermittelten Gensequenz konnen z. B. 
isogene Varianten ermittelt werden bzw. ob sich das ermittelte Gen in einem 
Operon befindet, in dem sich moglicherweise weitere essentielle Gene 
befinden. 
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In einem zweiten Teilschritt werden die identifizierten Gene in spezielle 
genetische Systeme uberfuhrt, die dazu dienen die Gene bzw. deren 
Genprodukte einem direkten Wirkstoff-Screening zuzufuhren und/oder die 
Gene bzw. Genprodukte dazu verwendet, bereits identifizierte Wirkstoffe 
weiter zu optimieren. Der wesentliche Vorteil des Gesamtverfahrens beruht 
auf der rasch aufeinanderfolgenden Ausfuhrung des Gen- und Wirkstoff- 
Screenings in aussagekraftigen brologischen Systemen, so daS in relativ 
kurzer Zeit aus dem kompletten Gensatz eines pathogenen Mikroorganismus 
die potentiellen Wirkstoffziele identifiziert, produziert und diese direkt zum 
Wirkstoff-Screening bzw. Optimierung eingesetzt werden konnen. 

Falls ein Mirkoorganismus untersucht wird, dessen Genom bereits 
sequenziert ist, kann die Identifizierung eines Gens oder Genabschnitts mit 
Hilfe von Datenbankanalysen erfolgen, wobei einem Sequenzabschnitt ein 
Leserahmen zugeordnet wird. Bevorzugt kann jedoch unabhangig vom 
Vorhandensein einer vollstandigenGenomerzeugungeinebeliebigeGenbank 
einer Vorselektion unterzogen werden. Dabei kann bevorzugt die 
Vorselektion auf Gene durchgefuhrt werden, die fur Polypeptide mit einer 
bestimmten Funktion kodieren, zum Beispiel mit Hilfe von 
Homologieanalysen. Die Vorselektion kann auch auf Gene durchgefuhrt 
werden, die nur in bestimmten Entwicklungsstufen exprimiert werden. 

Im Rahmen des ersten Teilschritts kann durch Selektionsschritte eine starke 
Reduktion des zu untersuchenden Genmaterials erzielt werden. Z.B. durch 
einen Anreicherungsschritt fur Gene, die fur exportierte oder sekretierte 
Genprodukte kodieren. In diesem speziellen Verfahren werden die DNA- 
Abschnitte einer Genbank von einem Pathogen mutagenisiert, was 
beispielsweise durch Klonieren eines solchen DNA-Abschnitts in ein 
Plasmid, Transformation in einen bevorzugt heterologen Wirtsorganismus 
und anschlie&ende Mutagenese erfolgen kann. Das daraus entstandene 
Expressionsprodukt kann dann nachgewiesen werden. Die Mutagenese kann 
beispielsweise durch Insertion einer Markersequenz erfolgen, welche bei 
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Expression der mutagenisierten Sequenz in einem Wirtsorganismus zu einem 
Fusionspolypeptid fuhrt, auf das selektiert werden kann. Die Insertion der 
Markersequenz ist nicht auf Transposoninsertion beschrankt, sondern kann 
auch auf andere Art und Weise erfolgen, beispielsweise durch homologe 
Rekombination oder Infektion und Rekombination mit Hilfe von 
Bakteriophagen. 

Die verwendete Markersequenz im Sinne der vorliegenden Erfindung ist im 
allgemeinen ein Gen, das fur ein Genprodukt kodiert, das eine Selektion auf 
diejenigen Wirtsorganismen erlaubt, welche diese Sequenz exprimieren. Im 
allgemeinen handelt es sich bei diesen Markersequenzen um Resistenzgene, 
die Resistenz gegen bestimmte Antibiotika verleihen, oder welche es dem 
Wirtsorganismus erlauben, in einem Selektionsmedium zu uberleben. Der 
Genmarker besitzt bevorzugt keine eigenen Expressionssignale, sondern ist 
direkt abhangig von einem vorgeschalteten Promoter, wie z.B. dem 
Transkriptionspromotor auf dem Promotersegment oder ein Promoter, der 
auf dem klonierten heterologen zu identifizierenden DNA-Fragment liegt. 
Alternativ zu Antibiotikaresistenz-Markersequenzen konnen auch Enzyme als 
Genmarker eingesetzt werden. In diesen Fallen wird die erfolgreiche 
Insertion durch eine bestimmte Farbreaktion angezeigt, welche die manuelle 
Isolierung des entsprechenden Bakterienklons erlaubt. 

Wenn die Markersequenz als Fusionsprotein mit dem Expressionsprodukt 
des inserierten DNA-Fragments exprimiert wird und eine Selektion wie oben 
beschrieben durchgefuhrt wird, kann DNA-Material aus den selektierten 
Bakterienklonen isoiiert werden und die DNA-Sequenz, die fur das 
Fusionsprodukt kodiert, nach bekannten Verfahren bestimmt werden. Dies 
erlaubt die Zuweisung eines Leserahmens zu dem zu identifizierenden DNA- 
Fragment. Es ist dann moglich, Vergleichsstudien mit allgemein verfugbaren 
DNA-Sequenzdatenbanken durchzufuhren, um die Identitat des 
identifizierten Gens abzuklaren und gegebenenfalls Hinweise auf eine 
biologische Funktion zu erlangen. 
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Durch technische und weitere Erganzungen der beiden unten dargestellten 
Verfahren, CAI und SRM, kann eine zielgerichtete Reduktion des 
Probenvolumens erreicht werden. Dabei handelt es sich ebenfalls um 
vorgeschaltete Selektionsverfahren, die auf bestimmte Gengruppen abzielen, 
z.B. der Einsatz subtraktiver Genbanken von pathogenen und apathogener 
Vertretern. Hierbei werden pathogenitatsvermittelnde Genbereiche 
angereichert. Derartige Subtraktionsverfahren konnen auch angewendet 
werden, um fur bestimmte Organismen spezifische Gene zu identifizieren, 
beispielsweise durch einen Vergleich und Subtraktion der Genomen von 
H. pylori und H.heilmannii. 

In weiteren Verfahren konnen z.B. Gengruppen identifiziert werden, die nur 
in einem bestimmten Entwicklungsschritt exprimiert werden. 
Hervorzuheben ist beispielsweise das Array-Verfahren, bei dem die 
einzelnen Genproben des Pathogens rasterformig auf einen Trager 
aufgebracht werden. Die einzelnen Auftragspunkte sind bekannt, so daft 
bei einer positiven Hybridisierungsreaktion mit den entwicklungsspezifischen 
Transkriptionsprodukten oder cDNAs oder subtraktiven cDNAs oder 
Fragmente davon, die jeweiligen Gene identifiziert und anschlieSend kloniert 
werden konnen. Andere Verfahren, die entwicklungsspezifische Gengruppen 
erfassen, sind vergleichende Proteom- und Differential-Display-Analysen. 

Um herauszufinden, ob es sich bei den identifizierten Gensequenzen um 
essentielle Gene handelt, werden Mikroorganismen hergestellt, welche in 
den Sequenzen defizient sind, welche den identifizierten Gensequenzen 
entsprechen. Die defizienten Mikroorganismen werden dann auf 
verschiedenen Wachstumsmedien bzw. Zellkulturen oder im Tiermodell oder 
im natiirlichen Wirt getestet, und die defizienten Gene konnen dann je nach 
Wachstumsfahigkeit einer Kategorie der nicht essentiellen, obligat 
essentiellen oder fakultativ essentiellen Gene zugeordnet werden. 
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Auf die Bedeutung von Genen, welche die Entwicklung aus der vitalen in die 
Uberdauerungsform und umgekehrt steuern, ist bereits eingangs 
hingewiesen worden. Es ist daher besonders bevorzugt, eine Vorselektion 
auf solche Gene durchzufuhren. Im Weiteren konnen Verfahren wie etwa 
CAI oder SRM angewendet werden und die gendef izienten Mikroorganismen 
dann auf bestimmten Nahrmedien untersucht werden, welche den Ubergang 
von der einen in die andere Form auslosen. Bei Helicobacter ist insbesondere 
das Schivo-Medium bevorzugt, welches die Reaktivierung der kokkoiden 
Form in die vitale spiralige Form ermoglicht. 

Die Erzeugung von defizienten Mikroorganismen kann auf mehrere Arten 
erfolgen. 

Es stehen eine Reihe von molekulargenetischen Verfahren zur Verfugung, 
das Genom eines bakteriellen Pathogens so zu mutagenisieren, dafc von 
jedem Gen eine Mutante zur Verfugung steht. Die gangigste 
Mutagenesemethode beruht auf der Inaktivierung von Genen, z. B. durch 
zufallig im Genom inserierende Transposons, die uber entsprechende Marker 
selektioniert werden. Fur dieses Verfahren bestehen zahlreiche Variationen, 
die auf verschiedene Organismen angewendet werden konnen. (Joyce und 
Grindley, 1984; Akerley, et aL, 1998). Mit Hilfe der inserierten 
Transposons lafct sich auch das mutagenisierte Gen im Genom genau 
lokalisieren. 

Hat man eine Genmutante mit einem nachweisbaren biologischen Effekt 
erzeugt, z.B. ein vermindertes Wachstum der Zellen in einem bestimmten 
Milieu, so muS in einem zweiten Schritt die eindeutige Kopplung des Gens 
bzw. des Genprodukts mit dieser Eigenschaft nachgewiesen werden. Dies 
geschieht in der Regel durch Komplementationsexperimente. In diesem Fall 
wird in den Organismus mit der spezifischen Genmutante das ursprungliche 
Gen eingebracht und exprimiert. Kann uber diesen Weg die ursprungliche 
Eigenschaft des Organismus regeneriert werden, ist der notwendige Beweis 
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erbracht. Allerdings lafct sich dieses Verfahren nicht bei der 
Charakterisierung von Letalmutanten anwenden, d.h. bei Mutanten obligat 
essentieller Gene. Einen Ausweg bietet die Verwendung konditionaler 
Mutationen zur Komplementation. Z. B. lassen sich durch chemische 
Mutagenese des untersuchten Gens temperatursensitive Mutanten 
erzeugen, die das Genprodukt bei der normalerweise optimalen 
Wachstumstemperatur in eine inaktive Zustandsform bringen und bei 
niedrigeren Temperaturen ein biologisch aktives Genprodukt hervorbringen 
(Das, et al., 1976; Harris, et al., 1992; Hou, et ah 1994; Polissi and 
Georgopoulos, 1996). In einem anderen praktizierten Ansatz werden die 
wildtypischen Komplementationen durch exogene Substanzen, sogen. 
Induktoren, gesteuert. Uber diese Induktoren wird die Expression des 
komplementierenden Gens eingeschaltet, das auf einem Episom in die 
genspezifische Mutante eingebracht wird und nach Induktion das fehlende 
Genprodukt ersetzt (Murphy, et al., 1 995-. Chow and Berg, 1 988; Arigoni, 
etal., 1998). 

Die genannten Verfahren sind sehr zeitaufwendig und werden nur fur die 
Untersuchung individueller Gene oder begrenzter genomischer Abschnitte 
eingesetzt. Verfahren, die eine durchgangige Charakterisierung einer 
vollstandigen, mutagenisierten Genbank eines ausgewahlten Pathogens 
nach dem beschriebenen Schema ermoglichen, sind bislang nicht bekannt. 

Die nachfolgend beschriebenen neuen genetischen Verfahren, die 
Konditionale Antisense-Hemmung (CAI) und die Subtraktive 
Rekombinationsmutagenese (SRM) erfullen diese Anforderungen. Beide 
Verfahren konnen zur Identifizierung essentieller Gene eingesetzt werden, 
wobei sich das CAI-Verfahren besonders fur die Identifizierung obligat 
essentieller Gene eignet und das SRM-Verfahren fur fakultativ essentielle 
Gene. 
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Das CAI-Verfahren beruht auf der konditionalen Hemmung der Translation 
von einem oder mehreren Genen, die auf einem klonierten Genomfragment 
(welches dann als Matrize oder Template dient) liegen und uber ein Plasmid 
im zu untersuchenden Keim propagiert werden. Im Vergleich zu 
konventionellen Verfahren bleibt die genomische Struktur des zu 
untersuchenden Keims unverandert, d.h. im Originalzustand. Im zu 
untersuchenden Keim wird die Hemmung der Translation durch die 
konditional induzierbare Synthese spezifischer Antisense-RNA (asRNA) 
ausgelost, die das komplette klonierte Genomfragment umfafct, inklusive der 
auf dem Genomfragment lokalisierten Gene. Die Antisense- 
Nukleinsauresequenzen konnen dann im Mikroorganismus in groSen Mengen 
synthetisiert werden und binden an die ursprungliche mRNA, wobei diese 
mRNA nicht mehr translatiert werden kann und somit dem 
Expressionsapparat entzogen wird. Die Folge ist, dal5 entweder kein 
Genprodukt oder nur geringe Mengen davon gebildet werden. Die Synthese 
der asRNA unterliegt der Kontrolle durch einen Promoter (asPromoter), 
dessen Aktivitat konditional, durch definierte, externe Signale gesteuert 
wird. Diese konditionale Inhibition der Expression eines Gens oder Operons 
erfolgt somit uber die Regulation der Synthese der asRNA durch den 
induzierbaren asPromoter. Zum Nachweis, daB ein Gen bzw. Operon, wie 
im vorliegendeh Fall, fur das Uberleben und die Vermehrung des Organismus 
unter bestimmten Bedingungen essentiell ist, wird die Uberlebens- und 
Vermehrungsrate eines Klons, in dem die Synthese der asRNA induziert ist, 
mit seiner Oberlebens-/Vermehrungsrate bei nicht induzierter asRNA 
Synthese verglichen. Ist die Uberlebens-A/ermehrungsrate des Klons bei 
Induktion der asRNA Synthese vermindert, so handelt es sich bei dem 
inhibierten Gen bzw. Operon um ein (obligat oder fakultativ) essentielles 
Gen. Diese Wachstumsanalysen konnen automatisiertdurchgefuhrt werden, 
so daS eine sehr grofce Anzahl von Genen innerhalb kurzer Zeit untersucht 
werden konnen. Aus diesen Klonen wird das Plasmid isoliert und die DNA- 
Sequenz des klonierten Genomfragments, das als Template fur die asRNA 
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Synthese dient, bestimmt und in Folge die Struktur des essentiellen Gens 
ermittelt. 

Ein fur das CAI-Verfahren geeigneter Plasmidvektor ist in Abbildung 1 
dargestellt. Erenthaltein genomischesodersubgenomisches DNA-Fragment 
aus dem zu untersuchenden Mikroorganismus unter der Kontrolle eines 
induzierbaren Promoters {P) und weiteren ublichen Expressionssignalen 
sowie ein mRNA-stabilisierendes Element, so date das DNA-Fragment in 
Form von Antisense RNA (asRNA) exprimiert werden kann und eine lange 
biologische Aktivitat hat. Ein geeigneter Promoter ist z.B. der Tet-Promoter. 
In einer besonders bevorzugten Ausfiihrungsform kodiert der CAI-Vektor 
zusatzlich ein Gen fur ein regulatorisches Protein, welches den Promoter 
reguliert, in diesem Fall, z.B. den Tet-Repressor, welcher durch ein exogenes 
oder extrazellulares Signal, wie z.B. Tetrazyklin, gesteuert werden kann. Der 
CAI-Vektor der besonderen Ausfuhrungsform von Abbildung 1 enthalt 
weiterhin ein oder mehrere selektionierbare Markergene sowie zwei 
Replikationsursprunge (ori), einen fur den zu untersuchenden 
Mikroorganismus (hier als Pathogen bezeichnet) und einen weiteren fur 
einen ublichen Klonierwirt z.B. E.colL Mit Hilfe solcher CAI-Vektoren konnen 
aus ganzen mikrobiellen Genomen Antisense-Bibliotheken erstellt werden. 

Abbildung 2 zeigt eine schematische Darstellung eines bevorzugten CAI- 
Verfahrens. Von einem CAI-Plasmid, das kleine Fragmente einer 
genomischen Bank des zu untersuchenden Mikrooganismus enthalt, wird 
asRNA von einem induzierbaren Promoter (Pj) aus, unter Kontrolle eines 
extrazellularen Signals synthetisiert (siehe Abb. 1). Die asRNA hybridisiert 
sequenzspezifisch mit der mRNA desjenigen Gens, das dem klonierten DNA 
Fragment auf dem CAI Plasmid entspricht. Durch die Bildung des asRNA- 
mRNA Hybrids wird die Translation dieser mRNA reduziert oder verhindert. 
In Folge entsteht ein defizienter Mikroorganismus, der nicht in der Lage ist, 
daS betreffende Genp^odukt zu bilden. Handelt es sich um das Produkt 
eines essentiellen Gens, dessen Bildung inhibiert wird (A), ist die 
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Lebensfahigkeit des entsprechenden Klons eingeschrankt oder verhindert. 
Die Lebensfahigkeit des Mikroorganismus wird im folgenden anhand seiner 
Lebens- oder Uberlebens- oder Vermehrungsrate in einem definierten 
biologischen System bestimmt. Bei nicht erfolgender Induktion der asRNA 
Synthese (B), oder wenn das CAI-Plasmid das Fragment eines nicht- 
essentiellen Gens enthalt (C), ist der Klon des Mikroorganismus normal 
lebens- und vermehrungsfahig. 

In besonders bevorzugten Ausfuhrungsformen des CAI-Verfahrens werden 
ganze Antisense-RNA-Plasmidbanken aus genomischen Fragmenten des zu 
untersuchenden Mikroorganismus analysiert (siehe Abbildung 3). Eine 
genomische Bank mit CAI-Plasmiden (siehe Abb. 1) wird in den zu 
untersuchenden homologen Mikroorganismus unter nicht-induzierenden 
Bedingungen ubertragen und die plasmidtragenden Klone uber einen 
plasmidkodierten Marker selektioniert. Die Lebensfahigkeit der einzelnen 
Klone, die jeweils ein bestimmtes CAI Plasmid aus der Genbank erhalten, 
wird anschliefcend anhand ihrer Vermehrungsrate unter induzierten bzw. 
nicht induzierten Bedingungen ( + und - in der Abbildung), bezogen auf die 
asRNA Synthese, im direkten Vergleich untersucht. In Klonen, die sich unter 
asRNA induzierenden Bedingungen kaum oder nur langsam vermehren, wird 
die Translation von mindestens einem essentiellen Gen verhindert. Aus 
diesen Klonen werden die CAI-Plasmide isoliert. Die essentiellen Gene 
werden durch Sequenzierung der genomischen Fragmente in den isolierten 
CAI-Plasmiden identifiziert. 

Dieser Ansatz laSt sich auch bevorzugt mit einem subtraktiven Verfahren 
kombinieren (SCAI), von dem eine Ausfuhrungsform zur Veranschaulichung 
in Abb. 4 dargestellt ist. Eine genomische Bank mit CAI-Plasmiden (siehe 
Abb. 1 und 3) wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen und die entstehenden individuellen Klone werden als bakterielle 
CAI-Bank in einem Pool zusammengefafct. Dieser Pool wird zur Selektion in 
zwei identische Gruppen (den Driver- und den Tester-Pool) aufgespalten. 
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Der Ausdruck "Driver" wird hierbei fur denjenigen Pool von bakteriellen 
Klonen verwendet, der so behandelt wird, daS der induzierbare Promoter 
aktiviert wird und asRNA vom CAI-Vektor exprimiert. Der "Tester"-Pool 
enthalt einen identischen Satz Klone mit CAI-Plasmiden, der jedoch unter 
nicht-induzierenden Bedingungen gehalten wird und somit Wildtyp- 
Eigenschaften besitzt. 

In der Regel wird der "Driver"-Pool zur Selektion {z.B. im Tier) eingesetzt, 
wahrend der "Tester"-Pool unbehandelt aufbewahrt wird. Es konnen aber 
auch beide Gruppen einer Selektion unterzugen werden, wobei lediglich der 
"Driver"-Pool durch Gabe des Signals (z.B. Tetrazyklin) induziert wird. 
Klone, in denen durch die Expression einer bestimmten asRNA die 
Translation eines essentiellen Gens gehemmt wird, gehen wahrend der 
Selektion aus der Gruppe verloren. Nach angemessener Zeit werden die 
uberlebenden Klone beider Gruppen wiedergewonnen und die CAI-Plasmide 
aus den Klonen beider Gruppen isoliert. Die klonierten genomischen 
Fragmente werden anschlieSend uber PCR amplifiziert, wobei Oligonukleotid 
Primer verwendet werden, die mit Vektorsequenzen seitlich der klonierten 
genomischen Fragmente hybridisieren. Diejenigen amplifizierten DNA 
Fragmente, die Teile von essentiellen Genen darstellten, werden durch 
subtraktive Hybridisierung (siehe Abb. 8) angereichert und isoliert. 

Ein erfindungsgemaS fur einen CAI-Vektor geeigneter Promoter ist 
beispielsweise der Tet-Promoter, dessen Aktivitat uber ein regulatorischen 
Proten (in diesem Fall den Tet-Repressor) gesteuert werden kann und durch 
ein extrazellulares Signal (Tetracyclin) induziert werden kann. Weitere 
induzierbare Promoteren sind im Stand der Technik bekannt. 

Antisense-RNA stabilisierende Elemente sind dem Fachmann auf diesem 
Gebiet bekannt und brauchen hier nicht naher erlautert zu werden. 
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Der hohe Wirkungsgrad des CAI Verfahrens bei der Inaktivierung von 
Einzelgenen in einem Organismus ergibt sich aus der uberlappenden 
Klonierung kleiner genomischer Fragmente und der damit einhergehenden 
Synthese unterschiedlicher asRNA Abkommlinge fur einen bestimmten 
Genbereich. Auf diese Art wird die Wahrscheinlichkeit, eine asRNA zu 
erhalten, welche die Translation des gesuchten Zielgens effizient inhibiert, 
stark erhoht. Derartige Untersuchungen konnen auf das komplette Genom 
eines Pathogens ausgerichtet werden, was die Uberprufung einer sehr 
grofcen Anzahl individueller genomischer Fragmente erforderlich macht. Hier 
sind apparative Hilfsmittel (Roboter) von Vorteil, urn einen hohen 
Probendurchsatz zu erzielen. Allerdings konnen in diesen Fallen nur 
bestimmte Zustande untersucht werden, z. B. das Wachstum der Zellen in 
einem bestimmten Medium. 

DurchdenzusatzlichenEinsatzsubstraktiverVerfahrensschritte(Subtractive 
Conditional Antisense Inhibition, SCAI), kann die Anzahl der zu 
untersuchenden individuellen Klone bevorzugt stark reduziert werden. 

Die Subtraktive Rekombinationsmutagenese (SRM) wird bevorzugt zur 
Identifizierung fakultativ essentieller Gene herangezogen. Im Unterschied 
zum CAI-Verfahren werden dauerhafte Genmutationen erzeugt, wobei die 
Anreicherung essentieller Gene uber einen substraktiven Schritt erreicht 
wird. Die SRM Methode kann wie das CAI Verfahren mit Genbanken von 
pathogenen Mikroorganismen durchgefuhrt werden. 

— — . wi iuiiiuii uci uiil qui uci it i ci iv l i v i ci ui ig ein^einer oene im uenom 

eines Pathogens durch vollstandige Insertion eines bestimmten 
Suizidplasmids, wobei dieses ein Teil einer Genbank ist. Die Insertion der 
Plasmide in das Genom erfolgt, durch homologe Rekombination. Die 
erfolgreiche Insertion wird durch Expression eines plasmidkodierten 
Antibiotikum-Resistenzmarkers angezeigt. 
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Eine bevorzugte Ausfiihrungsform der SRM-Methode wird anhand der 
Abbildungen 5 bis 8 veranschaulicht. 

In Abbildung 5 ist ein geeigneter SRM-Vektor dargestellt, der wie der CAI- 
Vektor ein genomisches oder subgenomisches DNA-Fragment des zu 
untersuchenden Mikroorganismus enthalt,sowieeinen Replikationsursprung 
(ori) fur einen Klonierwirt (z.B. E.coli), ein oder mehrere selektionierbare 
Markergene und einen weiteren konditional aktiven Replikationsursprung fur 
den zu untersuchenden Mikroorganismus, z.B. einen temperatursensitiven 
Ursprung oder einen Ursprung, dessen Aktivitat von einem in trans 
vorhandenen Replikationsfaktor abhangig ist und der zusatzlich in das 
System eingebracht werden kann. Dadurch daS das SRM-Plasmid eine 
genomische Sequenz des zu untersuchenden Mikroorganismus enthalt, 
kommt es bei Transfektion dieses Vektors in diesem Mikroorganismus zu 
einer homologen Rekombination, bei der das gesamte SRM-Plasmid in das 
genomische Gen des Mikroorganismus inseriert wird und das entsprechende 
Gen, fall es sich urn ein solches handelt, inaktiviert. Dies fuhrt zu einer 
Insertionsmutante. Geeignete induzierbare Replikationsursprunge sind, wie 
erwahnt, temperatursensitive oris oder solche, die durch einen Faktor 
gesteuer werden konnen, wie z.B. den RGK-Faktor pir oder den pWV Faktor 
rep A, der in trans dem System zugefuhrt wird. 

Die Insertion eines SRM-Plasmids (siehe Abb. 5) in das Genom des zu 
untersuchenden Mikroorganismus erfolgt uber homologe Rekombination 
zwischen dem im Plasmid klonierten genomischen Fragment des 
Mikrooganismus und der komplementaren, genomischen DNA Sequenz. 
Nachdem das Plasmid in den entsprechenden Mikroorganismus uberfuhrt 
worden ist, werden unter nicht permissiven Bedingungen, d.h. bei inaktivem 
ori, diejenigen Klone uber Selektion auf den plasmidkodierten Marker isoliert, 
in welchen das SRM-Plasmid in das Genom inseriert ist. Die Exzision des 
SRM-Plasmids erfolgt ebenfalls uber homologe Rekombination. Unter 
permissiven Bedingungen wird die Replikation des insertierten Plasmids 
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eingeleitet, wodurch genugende Mengen an freiem Plasmid in den Zellen 
entstehen, so daS das Plasmid aus dem Klon wieder isoliert werden kann. 
Sofern die Insertion eines SRM-Plasmids in ein essentielles Gen 
stattgefunden hat, wird die Lebensfahigkeit des betreffenden Klons 
eingeschrankt (A), wahrend Mutanten in nicht-essentiellen Genen normal 
lebensfahig sind (B). 

Ebenso wie beim CAI-Verfahren kann eine Bank von Insertionsplasmiden 
aus genomischen Fragmenten des zu untersuchenden Mikroorganismus in 
diesen Mikroorganismus ubertragen werden und genomische 
Insertionsmutanten gebildet werden. Diese bevorzugte Ausfuhrungsform des 
SRM-Verfahrens ist in Abbildung 7 dargestellt. Eine Bank von SRM- 
Plasmiden, die einzelne genomische oder subgenomische Fragmente 
enthalten, wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen. Unter Bedingungen, welche die Plasmidreplikation nicht 
erlauben, werden genomische Insertionsmutanten mit Hilfe eines 
plasmidkodierten Markers (siehe Abb. 5) selektioniert. In diesem Schritt 
konnen nur Insertionsmutanten uberleben, die in einem nicht- oder fakultativ 
essentiellen Gen mutiert sind, da Mutanten eines essentiellen Gens nicht 
lebensfahig sind. Die individuellen Insertionsmutanten werden in einem Pool 
zusammengefaBt und dieser Pool anschlieSend in zwei identische Gruppen, 
den Driver- und den Tester-Pool, aufgeteilt. Der Driver-Pool wird 
selektioniert, z.B. durch die Infektion eines Tiers. Der Tester-Pool bleibt 
unbehandelt. Durch die Selektion gehen solche Klone aus dem Driver-Pool 
verloren, die eine Insertion in einem fakultativ essentiellen Gen (das fur das 
Uberleben und die Vermehrung unter den Seiektionsbedingungen notwendig 
ist) enthalten. Anschlie&end werden aus den uberlebenden Klonen beider 
Pools, die in das Genom des Mikroorganismus inserierten Plasmide unter 
permissiven Bedingungen rezirkularisiert und zuruckgewonnen. In dem 
Driver-Pool fehlen solchen Plasmide, die Fragmente von fakultativ 
essentiellen Genen enthalten. Die in den SRM Plasmiden klonierten 
Fragmente werden in beiden Pools anschlieSend uber PCR amplifiziert (siehe 
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Abb. 4). Diejenigen amplifizierten DNA Fragmente, die Teile von fakultativ 
essentiellen Genen darstellen, werden durch genetische Subtrakion (siehe 
Abb. 8) angereichert und isoliert. 

Eine besondere Ausfuhrungsform, welche sich eine subtraktive 
Hybridisierung zur Anreicherung in Fragmenten essentieler Gene zunutze 
macht, ist in Abbildung 8 beispielhaft veranschaulicht. 

A: PCR-basierte genetische Subtraktion. Die Tester DNA-Fragmente 
(siehe Abb. 4 und 7) werden mit einem Adapteroligonukleotid in 
solcher Weise ligiert, daS der Adapter nur mit einem der beiden DNA 
Strange eines doppelstrangigen Tester DNA Fragments kovalent 
verbunden ist, was z.B. durch die Ligation eines doppelstrangigen, 
nicht phosphorylierten Adapters an die 3'-phosphorylierten DNA 
Fragmente der Tester DNA erreicht wird. Diese Tester DNA 
Fragmente werden dann mit einem molaren Uberschuss an Driver 
DNA Fragmenten gemischt. Die Mischung wird denaturiert und 
langsam rehybridisiert. AnschliefSend werden uberhangende 
Einzelstrangenden mit DNA Polymerase zum Doppelstrang aufgefullt. 
Die Produkte dieser Reaktion werden mittels PCR amplifiziert, wobei 
Oligonukleotid Primer verwendet werden, die den Adaptersequenzen 
entsprechen. Nur solche Tester DNA Fragmente, die nicht mit Driver 
DNA Fragmenten hybridisert haben, werden exponentiell amplifiziert 
somit angereichert und anschliefcend durch Klonierung isoliert. 

>: Genetische Subtraktion durch physikalische Abtrennung von 
biotinylierten DNA Fragmenten. Die Driver DNA Fragmente werden 
biotinyliert und anschlielSend im UberschuS mit Tester DNA 
Fragmenten gemischt, denaturiert und langsam rehybridisiert. Die 
biotinylierten Homo- Driver-Driver Doppelstrange und Heteroduplexe 
(Driver-Tester Doppelstrange) werden durch Extraktion mit Trager- 
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gekoppeltem Streptavidin von den Tester-Tester Homoduplexen 
abgetrennt. Letztere werden durch Klonierung isoliert. 

Die beispielsweise durch SRM erzeugten Insertionsmutanten werden in 
Tierversuchen oder Zellkultursystemen hinsichtlich ihrer veranderten 
biologischen Eigenschaften untersucht. Durch die gezielte Verwendung 
spezieller Wirtszellen, z.B. kultivierte Makrophagen oder Wirtsgewebe, z. B. 
Milz, konnen Gengruppen selektiert werden, die essentielle Eigenschaften 
des Pathogens determinieren, z.B. die Besiedlung bestimmter Wirtszellen. 
Isoliert man die uberlebenden Mutanten aus den Zellen, so fehlen die 
Mutanten essentieller Gene. Subtrahiert man aus der kompletten Genbank, 
die uberlebenden Mutanten, so erhalt man die Mutanten der essentiellen 
Gene. Dies geschieht uber einen speziellen PCR-basierten 
Substraktionsschritt. 

Das CAN bzw. das SRM-Verfahren ist eine sehr effiziente Methode zur ein- 
deutigen Identifizierung und Charakterisierung essentieller Gene. Da essen- 
tielle Gene ein naturliches Ziel fur inhibierende Wirkstoffe darstellen, bieten 
die dargestellten Verfahren eine ideale Grundlage fur die Entwicklung neuer 
Wirkstoffe. 

In den nachfolgend beschriebenen Verfahren werden die identifizierten Gene 
direkt zum Wirkstoff-Screening eingesetzt, wobei im Vergleich zu herkdmm- 
lichen Verfahren, auf aufwendige Aufreinigungsschritte verzichtet werden 
kann. Im Mittelpunkt dieser Verfahren stehen bakterielle Tragerzellen, die 
zum Screening nach prophylaktischen und therapeutischen Wirkstoffen 
eingesetzt werden konnen. 

Die hergestellten gendefizienten Mikroorganismen werden dann auf ihre 
Wachstumsfahigkeit oder ihre Uberlebensfahigkeit getestet. Geeignete 
Testsysteme sind z.B. /n-wYro-Systeme, Zellkultursysteme, Gewebekultur- 
systeme und Tiermodelle als naturliche Umgebung. Wird das Verfahren bei 
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H. pylori angewandt, werden die Organismen einerseits auf einem sog. 
Vollmedium angezuchtet, wobei das Vollmedium die bestmoglichen Voraus- 
setzungen fur ein Wachstum fur A/.p//or/erm6glicht. Gleichzeitig werden die 
defizienten H. pylori Organismen in einer Kultur gezuchtet, welche der 
naturlichen Umgebung von H. pylori moglichst genau entsprechen soli. Es 
werden hierzu einerseits Zellkulturen basierend auf Primarkulturen oder 
Zellinien aus gastrointestinalem Gewebe verwendet oder aber ausdifferen- 
ziertes Primargewebe (Spharoide) in Kulturmedium. Weitere Moglichkeiten 
zur Simulation der naturlichen Umgebung von H. pylori bestehen in der 
Verwendung von stimulierten Makrophagen, denn H. pylori besitzt die 
Fahigkeit, von diesen nicht aufgenommen und metabolisiert zu werden. 
AuSerdem kann auch uberpriift werden, ob die defizienten H. pylori 
Organismen in der Lage sind, sich in immundefizienten Mausen uber einen 
bestimmten Zeitraum zu etablieren. 

1st ein defizientes H. pylori Bakterium zwar in der Lage, auf Vollmedium zu 
uberleben, wachst aber nicht in einer naturlichen Umgebung, wie oben 
beschrieben, so wird das in diesem Organismus defiziente Gen als fakultativ 
essentielles Gen bezeichnet. 

Wenn der defiziente H. pylori Organismus in keinem der beiden Testlebens- 
raume Ciberlebensfahig ist, so handelt es sich um ein obligat essentielles 
Gen. 

Allgemein konnen Gene von Mikroorganismen einer dieser Kategorien 
zugeordnet werden. 

Aus diesen Ergebnissen konnen dann die in mutierten oder/durch asRNA 
unterdruckten Sequenzen identifiziert und jeweils einer dieser beiden 
Kategorien zugeordnet werden, oder aber der Kategorie der nichtessentiellen 
Gene, wenn der gendefiziente Organismus keine Beeintrachtigungen in 
seiner Wachstumsfahigkeit zeigt. 
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Eine weitere Aufgabe der vorliegenden Erfindung ist es, ein genetisches 
Verfahren zur Isolierung und Klonierung der identifizierten essentiellen Gene 
aus verschiedenen klinischen Helicobacter Isolaten bzw. aus heterologen 
pathogenen Keimen von klinischer Bedeutung bereitzustellen. Das 
erfindungsgemafce Verfahren umfafct daher weiterhin die Schritte 
(v) Herstellen von Primern zur Amplifikation und Detektion von 

homologen Gensequenzen in heterologen Mikroorganismen 
(VI) Identifizieren der homologen Gensequenzen. 

Eine bevorzugte Durchfuhrung dieser weiteren Verfahrensschritte besteht 
darin, sogenannte Megaprimer von den identifizierten essentiellen 
He/icobacter-Genen mittels PCR (Polymerase Chain Reaction) herzustellen, 
deren Sequenz direkt aus den entsprechenden Plasmiden der 
mutagenisierten DNA-Abschnitte abgeleitet werden kann. Diese Primer 
konnen dann verwendet werden, um die bereits identifizierten essentiellen 
Gene aus verschiedenen He/icobacter-\so\aten zu isolieren. Falls diese 
essentiellen Gene Entsprechungen in anderen Mikroorgansimen haben, 
konnen die Primer unter Umstanden auch zur Isolierung dieser Gene aus von 
/ye//co6acferverschiedenen Mikroorgansimen verwendet werden. Weiterhin 
kann dann die genaue DNA-Sequenz der isolierten Gene und die Feststellung 
der Genvarianz innerhalb der verschiedenen Helicobacter-\so\ate bzw. 
zwischen den verschiedenen Mikroorganismen bestimmt werden. 
Bei der Herstellung der Megaprimer entstehen DNA-Fragmente mit variablen 
3'-Enden. Aufgrund dieser Eigenschaft ist es moglich, die DNA-Fragmente 
zur Isolierung variabler, bzw. verwandter Gene mittels des beschriebenen 
PCR-Verfahrens einzusetzen. 

Identifizieren von spezifischen Wirkstoffen 

Zur Identifizierung neuer immunologischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwicklung dieser Wirkstoffe werden bakterielle Trager insofern sehr 
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wirksam eingesetzt, da die identifizierten Gene direkt in diese Tragersysteme 
kloniert und dort exprimiert werden konnen. Das Wirkstoff-Screening 
erfolgt dann direkt mit Hilfe dieser rekombinanten, bakteriellen Trager. Als 
Trager werden bevorzugt attenuierte Bakterien, wie z.B. Salmonellen, 
verwendet, da diese uber ein naturliches Potential zur Immunstimulanz 
verfugen. Werden diese attenuierten Bakterien als Trager bzw. 
Produzenten fur die identifizierten essentiellen Gene der pathogenen Keime 
verwendet und wird mit diesen Impfstammen eine Immunisierung an einem 
Saugetier durchgefiihrt, so kann eine nachhaltige Immunantwort ausgelost 
werden. 

Mittlerweile sind die immunologischen Eigenschaften dieser bakteriellen 
Tragersysteme so weit verfeinert worden, date eine gezielte Immunantwort 
ausgelost werden kann (VanCott et al., 1 998; Carrier-Patent EP981 1 6827. 
1). Diese Eigenschaft ist insofern bedeutsam, da die verschiedenen 
Krankheitserreger oftmals nur uber einen bestimmten Zweig des 
Immunsystems wirksam bekampft werden konnen. D.h. schutzvermittelnde 
Antigene lassen sich nur dann identifizieren, wenn sie dem Immunsystem 
in der richtigen Form prasentiert werden. Nur wenn der verwendete Trager 
mit einem wirksamen Antigen beladen wurde, kann es zu einer 
Schutzwirkung kommen. Aufgrund der vielfaltigen immunologischen 
Eigenschaften bakterieller Tragersysteme und deren Uberlegenheit 
gegenuber herkommlichen synthetischen Adjuvantien sind diese zur 
Identifizierung immunologisch relevanter Antigene besonders geeignet. 

Daruber hinaus konnen die bakteriellen Tragersysteme mit effizienten 
Genexpressionssystemen ausgestattet werden, welche die Herstellung auch 
problematischer Antigene erlauben (PCT/EP9 1 /02478, EP981 1 6827. 1 ). 
Aufgrund der direkten Subklonierung der isolierten essentiellen Gene und 
der einfachen Handhabung der bakteriellen Trager bei der Herstellung und 
Vakzinierung, konnen in relativ kurzer Zeit eine gro&e Anzahl von Antigenen 
hinsichtlich ihres immunogenen und protektiven Potentials durchgetestet 
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werden. In herkommlichen Verfahren miissen die Test-Antigene dagegen 
zeitaufwendigen Aufreinigungsverfahren unterworfen werden, wobei 
oftmals schon bei der gentechnischen Herstellung der ausgewahlten 
Antigene in Bakterien Schwierigkeiten auftreten, die mit der toxischen 
Wirkung dieser Antigene auf den produzierenden Bakterienstamm verkniipft 
sind. 

Eine wichtige Voraussetzung fur das Entwickeln von Wirkstoffen besteht 
darin, das irnmunogene Potential der identifizierten Sequenzen festzustellen, 
urn zu bestimmen, inwiefern die entsprechenden Genprodukte fur die 
Herstellung von Antikorpern oder Impfstoffen geeignet sind. 

Zur Identifizierung immunologischer Wirkstoffe gegen klinisch relevante 
Helicoba cfer-Organismen muB zunachst ermittelt werden, in wie weit das 
Genproduktdes identifizierten essentiellen Gens irnmunogene Eigenschaften 
besitzt. D.h. es muB experimentell ermittelt werden, ob mit dem Antigen 
eine humorale und zellulare Immunantwort in einem Saugetier ausgelost 
werden kann, die gegen das originate Genprodukt des Erregers gerichtet ist. 
Damit werden auf keinen Fall solche Antigene ausgeschlossen, die im 
Rahmen einer naturlichen Infektion vom Immunsystem nicht erkannt 
werden. Im Gegenteil, vielmehr konnte man erwarten, da& z.B. bei 
chronisch infizierten Menschendielmmunantwortgegenschutzvermittelnde 
Antigene unterdruckt ist oder von einer Qualitat ist, die letztendlich keine 
Schutzwirkung vermittelt. AuszuschlieSen sind jedoch solche Antigene, die 
einer hohen genetischen Variation unterliegen und somit einer wirksamen 
Immunantwort kaum zuganglich sind. 

Zum Nachweis der Identitat des identifizierten Genprodukts bei einer 
naturlich vorkommenden Infektion, wird Antiserum von Patienten 
gewonnen, die entweder unter einer aktiven Gastritis mit Beschwerden 
leiden, oder aus Patienten, bei denen die//e//co6acter-Infektion symptomlos 
verlauft. Mit diesen Seren wird das elektrophoretisch aufgetrennte 
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rekombinante Protein in einem klassischen Western Blot Verfahren getestet. 
Findet eine Erkennungsreaktion mit einem rekombinanten Protein jeweils mit 
beiden Seren, also dem eines Patienten mit einer fulminanten und dem eines 
Patienten mit einer symptomlosen Helicobacter Infektion, statt, so spielt 
dieses Protein bei einer naturlichen Infektion eine Rolle. Wird das 
rekombinante Polypeptid dagegen nur von dem Serum des Patienten mit 
einer symptomlosen Infektion erkannt, kann das zusatzlich ein Hinweis auf 
ein protektives Potential des entsprechenden Proteins sein. Weiterhin 
konnen Antikorper, die gegen dieses Protein spezifisch gerichtet sind, 
moglicherweise zur passiven Immunisierung eingesetzt werden. 

Von besonderem Interesse sind auBerdem Antikorper von Individuen, die 
nachweislich keine He/icobacter-Trager sind, da diese auf ein protektives 
Potential eines entsprechenden rekombinanten Polypeptids schlieSen lassen. 

Desweiteren werden die immunogenen Polypeptide zusammen mit 
geeigneten Zusatzstoffen zur Immunisierung in vivo eingesetzt. Verwendet 
werden dazu verschiedene Adjuvantien, bakterielle Toxine, Zytokine oder 
ein erfindungsgemaSes Polypeptid als Lebendvakzin. Die Immunantwort 
wird daraufhin getestet, ob sie nach einer erfolgten Verabreichung eines 
bestimmten Polypeptids der Erfindung in Kombination mit entsprechenden 
Zusatzstoffen nach Infektion mit dem homologen Keim eine schutzende 
Wirkung gegen weitere homologe Infektionen herbeifuhrt (z.B. Infektionen 
mit verschiedenen H. pylori Stammen). 

Noch eine weitere Moglichkeit zum Testen der Immunogenitat besteht darin, 
im Tiermodell (z.B. Maus, Kaninchen) eine Immunantwort gegen 
Helicobacter oder andere Mikroorganismen auszulosen und aus den 
immunisierten Tieren Antikorper zu gewinnen, die dann in einer weiteren 
Western-Blot-Analyse verwendet werden konnen. Gleichzeitig mussen 
Patientenbiopsien in situ immunologisch mit den gleichen Antikorpern 
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untersucht werden, da Helicobacter und andere Mikroorganismen in Kultur 
bestimmte Proteine verlieren oder hinzugewinnen kdnnen. 

Parallel dazu ist es bevorzugt zu untersuchen, ob gegen eine Infektion mit 
heterologen Keimen (bevorzugt andere gram-negative Bakterien), welche 
das entsprechende Polypeptid exprimieren, eine schutzende Wirkung erzielt 
werden kann. 

Nachdem festgestellt wurde, ob die identifizierten Gene bzw. deren 
Expressionsprodukte in der Lage sind, eine Immunantwort hervorzurufen, 
kann gemalS dem Verfahren der Erfindung weiterhin untersucht werden, ob 
auch eine bereits bestehende Infektion mit derartigen Antigenen behandelt 
werden kann. Kann auf diese Weise ein Polypeptid identifiziert werden, das 
eine therapeutische Wirkung zeigt, wird es bevorzugt auch auf seine 
Aktivitat bei Infektionen mit heterologen Keimen untersucht. 

Das Screening nach prophylaktisch bzw. therapeutisch wirksamen, 
immunologischen Stoffen kann nach folgendem Schema verlaufen, wobei 
die Einhaltung der einzelnen Schritte nicht zwingend ist: 

1. Klonierung des identifizierten Gens in einen geeigneten bakteriellen 
Tragerstamm und Nachweis sowie Quantifizierung des vollstandigen 
Genprodukts durch SDS-PAGE. 

2. Immunologische Charakterisierung des erzeugten Genprodukts mit 
Hilfe von (a) Seren infizierter oder/und naturlich geschutzter Wirte, 
die das Genprodukt im Tragerstamm erkennen sollte; (b) 
Hyperimmunseren von Tieren, die mit dem rekombinanten 
Tragerstamm immunisiert wurden. Wobei das jeweilige 
Hyperimmunserum das originale Genprodukt im pathogenen Keim 
erkennen sollte. Hierbei kann es moglich sein, daS das originale 
Antigen nur in einem bestimmten Entwicklungszeitraum vom 
Pathogen produziert wird. 
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3. Die protektive Wirkung der individuellen Antigene in der 
prophylaktischen oder/und therapeutischen Anwendungsform wird im 
Tiermodell untersucht. 

Alle protektiven Antigene, die mit den beschriebenen Verfahren identifiziert 
wurden, konnen nunmehr in einem zweiten Schritt weiterentwickelt werden . 
Im Vordergrund dieser Weiterentwicklung steht u. a. die Evaluierung der 
genetischen Konstanz der identifizierten protektiven Antigene innerhalb des 
Pathogens bzw. verwandter pathogener Keime in seiner weltweiten 
Verbreitung. Weiterhin wird zur Entwicklung wirksamer Impfstoffe, auf die 
genetischen Unterschiede im Immunsystem der Impflinge eingegangen. Ziel 
beider Verfahren ist die Identifizierung von Antigenen oder Epitopen, die 
mdglichst breit angewendet werden konnen. Zur Erfassung der 
Genvariabilitat innerhalb einer Spezies bzw. homologer Keime kann der 
sogenannte Mega-Primer-Ansatz eingesetzt werden. Aus dem Plasmid mit 
dem relevanten Gen werden direkt genspezifische Primer mit variablen 3'- 
Enden uber PCR hergestellt, welche die Amplifikation homologer Gene 
ermoglichen. Anhand der ermittelten DNA-Sequenz der amplifizierten Gene 
kann deren Variabilitat abgeleitet und z.B. genkonstante Bereiche bestimmt 
werden. 

Die genetischen Unterschiede zwischen einzelnen Impflingen, auf ein 
definiertes Antigen zu reagieren, kann mit Hilfe einer In l//Yro-Vakzinierung 
evaluiert werden. Aus unterschiedlichen Spendern werden hierzu 
antigenprasentierendeZellen (APC) isoliert,z.B.dentritischeVorlauferzellen, 
welche in vitro expandiert und mit den zu testenden Antigenen beschickt 
werden, wobei die Antigene bevorzugt uber entsprechende Vektoren 
exprimiert werden. Die identifizierten Gene konnen auch einzeln oder in 
definierten Kombinationen in dendritischen Zellen (DC) von nicht infizierten 
Spendern exprimiert werden. Dabei werden die Genprodukte von der 
Wirtszelle prozessiert und durch den MHC-Komplex prasentiert. DC sind 
besonders fur die Antigenprasentation gegenuber naiven oder 
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"schlummernden" T-Zellen geeignet. Werden DC mit T-Zellen autologer 
Spender inkubiert, ist es moglich zu bestimmen, ob dieser Spender gegen 
das eingesetzte Antigen reagieren wiirde, wenn er auf naturliche Weise 
damit in Kontakt kame, z.B. im Rahmen einer Schutzimpfung. Anhand der 
Immunantwort der T-Zellen kann auf eine mogliche Immunogenitat des 
entsprechenden Antigens geschlossen werden. Eine solche Immunantwort 
besteht beispielsweise aus einer Proliferation der T-Zellen, bzw. einer 
Zytokin-Ausschuttung insbesondere von IL-2 und IL-4. Die Zytokine konnen 
beispielsweise mit Hilfe eines kommerziell erhaltlichen Assaykits (z.B. von 
Genzyme Cambridge M.A.) ausgewertet werden. 

Schliefclich konnen die in der beschriebenen Weise identifizierten und 
charakterisierten Antigene bzw. Epitope zur Entwicklung der ersten 
Impfstoff-Prototypen eingesetzt werden. Hierbei wird zwischen zwei 
Impfstofftypen unterschieden, der aktiven und der passiven Impfung. 

Zur passiven Immunisierung, werden dem Impfling Antikorper oder 

Antikorperfragmentemitschiitzenderbzw.inhibierenderWirkung vonauRen 
zugefuhrt. 

Antikorper werden in Form von polyklonalen, bevorzugt monoklonalen 
Antikorpern (MAKs) oder rekombinanten Antikorpern bereitgestellt. Hierzu 
gehoren Antikorper, die spezifisch mit Polypeptiden der Erfindung oder 
deren Untereinheiten und Fragmenten reagieren und fur eine prophylaktische 
und/oder therapeutische Anwendung, z.B. einer passiven Immunisierung, 
verwendet werde konnen. Diese Anti-Protein- oder Anti-Peptid-Antiseren 
bzw. monoklonalen Antikorper konnen mit Hilfe von Standardprotokollen 
z.B. durch die Immunisierung von Tieren wie Mausen, Ratten oder Ziegen 
mit einem gereinigten Polypeptid der Erfindung, einen Fusionsprotein oder 
einem Subfragment dessen hergestellt werden. Daruber hinaus konnen die 
Tiere auch mit bakteriellen Vakzinetragern immunisiert werden, die mit 
entsprechenden Genen der Erfindung ausgestattet sind und die kodierten 
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Polypeptide exprimieren. Die Antikorper sind dabei bevorzugt 
immunspezifisch gegen antigene Determinanten oder Epitope hierzu der 
beschriebenen Heficobacter-Polypeptide oder einem eng verwandten 
Polypeptid, das eine Homologie von mindestens 90% besitzt, gerichtet. Sie 
sind nicht kreuzreaktiv mit Polypeptides die z.B. eine Homologie von 
weniger als 80% aufweisen. 

Ausgehend von einer Zellinie, die einen Polypeptid-spezifischen 
monoklonalen Antikorper produziert, kann aus dem kodierenden Gen eines 
solchen Antikorpers, chimare Gene geschaffen werden, die Antikorper 
determinieren, bestehend aus einer Antigen bindenden Domane aus der 
Maus und dem Fc-Teil eines Antikorpers des Menschen. Diese Antikorper 
konnen in Zellinien oder transgenen Tieren produziert werden. 

Anstelle von Antikorpern, die im Tier generiert wurden, konnen auch 
Antikorper-Fragmente, Miniantikorper, verwendet werden, die z.B. in einem 
heterologen System wie Bakterien hergestellt werden. Diese Miniantikorper 
konnen entweder monovalent oder bivalent sein und bestehen aus 
dimerisierten Einzelketten-Molekulen (Kujau et al. f 1998; Kalinke et al., 
1996; Pack et al., 1993). 

Antikorper gegen die immunogenen Polypeptide der Erfindung konnen auch 
in Pflanzen generiert werden. Beispiele hierzu sind z.B. von Hiatt und Ma 
(1 993), van Engelen etal. (1994) und Maetal. (1994) beschrieben worden. 
Entsprechend der jeweilig verwendeten Pf lanze konnen diese z.B. direkt zum 
Verzehr und damit als orales Vakzin verwendet werden. 

Eine weitere, sehr breit anwendbare Weise, Antikorper herzustellen, ist in 
Milch und Eiern immunisierter Tiere. Verabreicht man z.B. trachtigen Kuhen, 
Schafen oder Pferden geeignete Antigene, so finden sich in der Milch 
Immunoglobuline, die zur Entwicklung eines Vakzins verwendbar sind. Die 
Milch kann dann entweder direkt als Vakzin verabreicht werden, oder ein 
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konzentriertes Immunglobulin-Extrakt hergestellt werden. Auf die gleiche 
Weise konnen auch Antikorper (Hyperimmunantikorper) in Huhnereiern 
produziert werden (Ling et al., 1 998; Sasse et al., 1 998). Die beschriebenen 
immunogenen Polypeptide der Erfindung konnen daher auch zur Entwicklung 
eines Milchprodukts oder Huhnereiern verwendet werden, die als orales 
Vakzin verwendet werden konnen. 

ErfindungsgemaS werden die generierten Antikorper oder deren Fragmente 
auf ihre An wendbarkeit getestet. Sie konnen dazu durch bekannte Verfahren 
aufgereinigt werden (Prazipitation, chromatographische Verfahren) und bei- 
spielsweise darauf untersucht werden, ob sie den Infektionsvorgang von H. 
pylori inhibieren konnen (Adhasionsassays) oder aktivierend auf Komple- 
ment oder ADCC ("antibody-dependent cell-mediated cytotoxicity", anti- 
korperabhangige zellvermittelte Zytotoxizitat) wirken. 

Zur passiven Immunisierung werden die Antikorper, die mit Hilfe der 
Polypeptide der Erfindung generiert wurden, entweder oral oder intra- 
gastrisch verabreicht. Hierfur werden die Antikorper mit einem Bicarbonat- 
Puffer gemischt. Sie konnen aber auch systemisch verabreicht werden, 
wobei sie nicht gepuffert werden mussen. 

Antikorper werden bevorzugt allein oder auch in Kombination mit anderen 
nicht-immunologischen Wirkstoffen verwendet, z.B. mit Antibiotika oder 
Protonenblockern. 

Aktive Vakzinierung beruht auf einer Immunreaktion, die vom geimpften 
Organismus selbst ausgelost wird. Bevorzugt sind Darreichungsformen von 
Impfstoffen als Antigene, Antigenfragmente, Subunit-Vakzin, als DNA- 
Vakzin, als Lebend-Vakzin oder als Lebensmittel-Vakzin. 

Antigene sind diejenigen Polypeptide oder deren Fragmente, die in vivo eine 
Immunreaktion hervorrufen konnen. 
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Wenn ein Polypeptid als Subunit-Vakzin bereitgestellt werden soil, wird es 
zunachst in seine Untereinheiten bzw. Strukturdomanen gemaS seines 
Antigenitatsmusters zerlegt (z.B. T- und B-Zell-Epitope). Dieses 
Antigenitatsmuster kann mit Hilfe eines Computerprogramms erstellt 
werden, wobei immunogene Regionen, die aus einer kurzen Polypeptid- 
sequenz von ca. 8 bis 10 Aminosauren bestehen, erkannt werden konnen 
(Hughes et aL, 1992). Die einzelnen Polypeptidstucke konnen dann 
anschlie&end auf ihre Immunogenitat in der Maus oder in Primaten bzw. den 
Menschen getestet werden. Sie konnen dazu entweder als gereinigte 
Polypeptide, die synthetisch hergestellt wurden, in Kombination mit 
entsprechenden Zusatzstoffen wie einem Adjuvans, Toxin oder Cytokin 
verabreicht werden, oder als Fusionsprotein an ein bekannt immunogenes 
Protein bzw. Proteinuntereinheit wie z.B. die Cholera Toxin B Untereinheit 
(Liljeqvist et aL, 1997) gekoppelt. Weiterhin konnen die immunogenen 
Peptide in auBere Membranproteine wie z.B. dem OmpS Maltoporin von 
E.coli eingebaut und heterolog in einem Vakzin-Tragerstamm exprimiert 
werden (Lang und Korhonen, 1997). 

Zur Entwicklung eines DNA-Vakzins konnen die in der Erfindung 
charakterisierten Polynukleinsaure-Molekule "nackt" in Fusion mit einem 
eukaryontischen gewebespezifischen Promoter oder in Form eines Plasmids 
verabreicht werden. Die "nackte" DNA oder das entsprechende Plasmid 
wird in Kombination mit einem Zusatzstoff wie einem Reagenz, das die 
zellulare Permeabilitat verandert wie z.B. Bupivacain (W094/1 6737), 
kationischen Lipiden wie z.B. DOTMA (N-[1 -(2,3-dioleyloxy)propyl]-N,N,N- 
trimethyl-ammoniumchlorid, DOTAP (1 ,2-bis(oleyloxy)-3-trimethyl- 
ammonio)propan), DDAB (dimethyl-dioctadecyl-ammoniumbromid), DOGS 
(dioctadecyl-amidolglycyl-spermidin) bzw. Cholesterinolderivaten, Silica, 
Gold oder Wolfram (Tang et aL 1992) bzw. in Liposomen (W093/18759, 
W093/19768, WO94/25608, W095/2397) oder Mikropartikeln verpackt, 
verabreicht. Beispiele fur brauchbare Promoteren und Genfahren sind von 
Hartikka et al. (1996) beschrieben worden. Zur Applikation der 
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Polynukleotid-Molekule konnen jedoch auch z.B. attenuierte Salmonellen 
verwendet werden. Die Bakterien werden hierfur mit eukaryontischen 
Expressionsvektoren, die ein Polynukleotid-Molekul der Erfindung beinhalten, 
transformiert und dann oral verabreicht. Die Plasmid-DNA wird anschlieSend 
vom Bakterium auf den Wirt ubertragen (Darji et aL, 1997). Zur 
Transformation attenuierter Tragerbakterien konnen jedoch auch filamentose 
Phagen verwendet werden. Der Vorteil dieser liegt darin, daS sie eine 
extrem hohe Anzahl von Plasmiden ubertragen konnen. 

Fur die Entwicklung eines Lebendvakzins stehen unter anderem virale, wie 
z.B. adenovirale oder Windpocken-Virus-Vektoren, bzw. bakterielle Vektoren 
wie etwa Salmonella, Shigella oder Lactobacillus zur Verfugung. Attenuierte, 
nichtvirulente Salmonella typhimurium-SXamme, die zur rekombinanten 
Expression heterologer Antigene benutzt werden konnen und oral 
verabreicht werden, wurden vielfach charakterisiert (Mekalanos, 1994, 
W092/11361, Cirillo et aL, 1995 und Dorner (1995). Weitere bakterielle 
Vektoren, die als Vakzinvektoren verwendet werden konnen, sind von Cirillo 
et aL, (1995) und Dorner (1995) beschrieben worden. Ein Polynukleotid- 
Molekul der Erfindung, das fur ein therapeutisch oder prophylaktisch 
wirksames Polypeptid kodiert, wird hierzu entweder in das bakterielle 
Genom stabil integriert und einem Transportsystem unterworfen, das die 
Darbietung an der bakteriellen Oberflache ermoglicht (PCT/EP94/04286; 
WO97/35022) . Das entsprechende Polynukleotid-Molekul kann im 
Bakterium aber auch als Plasmid in freiem Zustand vorliegen. 

Impfstoffe werden in der Regel mit geeigneten Zusatzstoffen wie z s B s 
Adjuvantien, bakteriellen Toxinen, Zytokinen etc. verabreicht, die das 
immunogene Polypeptid in seiner protektiven oder therapeutischen Wirkung 
unterstiitzen. Adjuvantien mit geringen Nebenwirkungen zur Verwendung 
im Menschen, die fur Subunit-Vakzine und Lebend-Vakzine, aber zum Teil 
auch fur DNA-Vakzine in Frage kommen, sind z.B. Aluminiumhydroxid, 
Aluminiumphosphat, Calciumphosphat, N-Acetyl-muramyl-L-threonyl-D- 
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isoglutamin, N-Acetyl-normuramyl-L-alanyl-D-isoglutamin, N-Acetyl- 
muramyl-L-alanyl-D-isoglutamyl-L-alanin-2-(1 / -2'-dipalmitoyl-sn-glycero-3- 
hydroxyphosphoryloxy)-ethylamin, Liposomen, Monophosphoryl-Lipid A, 
Trehalosedimicoloat, Pilz-Polysaccharide wiez.B. Schizophyllan, Muramyl- 
Dipeptid, Muramyl-Dipeptid-Derivate, sowie Phorbolester, Saponine und 
immunstimulierende Komplexe (ISCOMS) (Gupta und Siber, 1995). Als 
bakterielles Toxin kann z.B. Cholera Toxin bzw. dessen Untereinheiten oder 
das hitzelabile Toxin aus E.coli verwendet werden. Obwohl diese 
hochpotent als Adjuvantien aktiv sind, konnen sie aufgrund ihrer Toxizitat 
nur begrenzt auf den Menschen angewendet werden. Mit Hilfe bestimmter 
Mutagenesetechniken konnenjedoch Molekuleentwickelt werden, dieaktiv, 
aber ungiftig sind (O'Hagan, 1998). 

Eine weitere Moglichkeit, die Immunantwort auf die prophylaktisch und/oder 
therapeutisch wirksamen Substanzen der Erfindung zu optimieren, ist, das 
entsprechende Polypeptid als Fusionsprotein mit einer immunogenen 
Proteindomane zu exprimieren. Eine Moglichkeit besteht z.B. darin, die Pilin 
DSL-Domane aus Pseudomonas aeruginosa als Fusionspartner zu 
verwenden. Weiterhin beschrieben sind Fusionsproteine, die an Glutathion 
S-Transferase oder Thioredoxin fusioniert wurden (Hill et al., 1997; 
Gabelsberger et al., 1 997). Das entsprechende Fusionsprotein kann jeweils 
als Subunit- oder Lebendvakzin hergestellt und verabreicht werden. 

Die Immunantwort der identifizierten immunologisch wirksamen Substanzen 
kann auch insofern moduliert werden, indem diese in Kombination mit 
bestimmten Zytokinen verabreicht werden. Zur simultanen Verabreichung 
bietet sich eine Co-Expression der Polynukleotid-Sequenzen der Erfindung 
mit einem bestimmten Cytokin in Salmonella oder einem anderen 
Wirtsbakterium an. Das entsprechende Cytokin kann hierzu entweder auf 
einem separaten Plasmid, in Reihe oder als Fusionsprotein mit der 
gewiinschten Polynukleotid-Sequenz der Erfindung kodiert sein und dann in 
das Wirtsbakterium transformiert werden. In Frage kommen Cytokine, die 
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wie z.B. lnterleukin-6 (IL-6), lnterleukin-1 0 (IL-1 0) oder lnterleukin-1 2 (IL-1 2) 
das Immunsystem stimulieren. 

Zur weiteren Optimierung kdnnen einzelne immunogen wirksame 
Substanzen der Erfindung miteinander oder in Kombination mit bekannten 
immunogenen Substanzen wie z.B. VacA bzw. dessen einzelne 
Untereinheiten kombiniert werden. Das entsprechende Polypeptid kann also 
gemeinsam mit mindestens einem weiteren Helicobacter Antigen, wie z.B. 
der nativen Urase oder deren Untereinheiten, Fragmenten Homologen, 
Mutanten oder Derivaten derselben exprimiert werden. Au&erdem konnen 
z.B. verschiedene Subunit-Vakzine einzeln oder als Fusionsprotein wie 
weiter oben beschrieben gemeinsam verabreicht werden. Hierfur konnen 
wiederum z.B. gereinigte Polypeptid-Molekule in Kombination mit einem 
geeigneten Adjuvans, bakteriellen Toxin oder Cytokin verwendet werden. 
Weiterhin konnen diverse Kombinationen von Nukleotid-Sequenzen 
immunogener Untereinheiten der beschriebenen Polypeptid-Molekule auf 
einem gemeinsamen Plasmid hergestellt und als Lebendvakzin verabreicht 
werden. Ein Vakzinvektor der Erfindung kann also ein oder mehrere 
Polypeptide der Erfindung, Derivate bzw. Fragmente dergleichen enthalten. 
AuSerdem besteht die Moglichkeit der Kombination eines DNA-Vakzins mit 
ein oder mehreren gereinigten Subunit-Vakzinen in einer geeigneten 
Tragersubstanz, wie bereits weiter oben beschrieben wurde. 

Zur Identifizierung neuer pharmakologischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwickiung dieser Wirkstoffe konnen ebenfalls bakterielle Trager sehr 
wirksam eingesetzt werden, da die identifizierten Gene direkt in diese 
Tragersysteme kloniert und dort exprimiert werden konnen. Das Wirkstoff- 
Screening erfolgt dann direkt mit Hilfe dieser rekombinanten, bakteriellen 
Trager. 
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Display-Systeme dienen dazu, ein exprimiertes Polypeptid der Erfindung an 
der Zelloberflache von Bakterien zu prasentieren. Den Transport von 
Polypeptiden durch die innere Membran ermoglicht ein Signalpeptid am 
Aminoende, wahrend andere Anteile die Einlagerung und Verankerung in der 
au&eren Membran ubernehmen. Als Trageranteile sind verschiedene auSere 
Membranproteine von E.coli beschrieben worden wie z.B. PhoE (Agterberg 
etal., (1990) oder OmpA (Francisco etal., 1992). Es konnen jedoch auch 
Fusionen mit der Transportdomane des IgA-Proteasevorlaufers IgAfc 
verwendet werden (Klauser etal. , 1 990) . Beispiele fur Display-Systeme sind 
z.B. das DsbA-System (PCT/EP 94/02486) oder das Autotransporter-System 
(AIDA; WO97/35022). Die an der Oberflache prasentierten Polypeptide 
konnen dann fur Bindungsstudien mit Peptid- oder kombinatorischen 
chemischen Substanzenbanken verwendet werden. Die Bindungsstudien 
konnen mit Hilfe eines "High Through Put" Systems, das hohe Testraten 
ermoglicht, in Flussigkeit oder aber gebundener Form durchgefuhrt werden. 
Hierfur werden die prasentierten Polypeptide z.B. an ein Chromatophor 
gekoppelt, das in Kombination mit einem weiteren Chromatophor, das an 
das Wirkstoff-Peptid oder die chemische Substanz gekoppelt ist, eine 
Farbreaktion ermoglicht. Die entsprechende Wirkstoffkomponente kann 
jedoch auch z.B. mit einem Fluoreszenzfarbstoff markiert oder an eine feste 
Tragermatrix gekoppelt sein. Bei Verwendung eines "Solid Phase Systems" 
wird vorher entweder das verwendete Polypeptid der Erfindung oder aber 
umgekehrt die Peptid- bzw. kombinatorische Wirkstoffbank an die 
Tragermatrix gekoppelt. Die jeweilige f arbstoff markierte Komponente bindet 
dann an die immobilisierte Komponente, wodurch wieder eine Farbreaktion 
ermoglicht wird. Nach der Bindungsreaktion mussen dann mehrere 
Waschvorgange vollzogen werden, bevor die entsprechende Substanz 
isoliert wird. Vorteil des "Solid Phase Systems" gegenuber der Bindung in 
Flussigkeit ist, date die wirksame Substanz schneller isoliert werden kann, 
da die ungebundenen Substanzen weggewaschen sind. 
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Weitere Verfahren zur Iclentifizierung neuer pharmakologischer Wirkstoffe 
basieren auf den Kenntnisse aus der Primarstruktur der identifizierten 
essentiellen Gene bzw. benutzen die aufgereinigten gentechnisch 
hergestellten Genprodukte. 

Eine alternative Ausfuhrungsform des erfindungsgema&en Verfahrens 
besteht darin, spezifische Bindepartner der von den identifizierten Genen 
kodierten Polypeptide zu finden. 

Es konnen bevorzugt Homologiestudien mit Helicobacter und anderen 
Organismen durchgefuhrt werden, z.B. mit Hilfe von Computer-Alignments, 
Southern Blots, PCR und dgl. und anschliefcender Zuordnung der 
Sequenzen. Aufgrund von Homologien kann dann auf potentielle 
Bindepartner der Proteine geschlossen werden. 

Ebenfalls bevorzugt konnen auch kombinatorische Bindungsstudien uber 
Target-gerichtetes-Screening-Verfahren mit Hilfe von Substanzen- 
Bibliotheken durchgefuhrt werden. Die potentiellen bindenden Substanzen 
werden in einer speziellen Anordnung gebunden vorgelegt, z.B. in 
Mikrotiterplatten oder anderen Tragermaterialien. AnschlieBend wird das 
"Target", in der Regel aufgereinigte, gegebenenfalls rekombinante 
Heficobacter-Pr ote'me, in loslicher Form hinzugegeben, was den Nachweis 
einer Wechselwirkung zwischen dem Target und bestimmten Substanzen 
ermoglicht. Ein indirekter Nachweis kann durch markierte Antikorper, die 
gegen die Substanz gerichtet sind, oder durch Einfuhren zusatzlicher 
Elemente ("Tags") in das Target erbracht werden. 

Eine weitere Variante der Bindungsstudien besteht in der Expression von 
He/icobacter-Prote'men in rekombinanten Bakterien (z.B. solche, die das 
fluoreszierende Protein GFP oder bestimmte Enzyme herstellen), welche die 
Proteine auf der Oberflache prasentieren, und anschliefcendes Testen einer 
Substanzen-Bibliothek. 
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Weiterhin kann die dreidimensionale Struktur der von den 
erfindungsgemafcen identifizierten Genen kodierten Polypeptide Oder deren 
Fragmente auch durch kristallographische Analyse ermittelt werden. Bei 
ausreichender Auflosung konnen eventuelle "Taschen" oder sonstige 
Bindestellen in ihrer dreidimensionalen Struktur exakt charakterisiert werden. 
Aufgrund dieser Daten kann die Struktur potentieller Bindepartner berechnet 
werden. 

Mit Verfahren, wie etwa "Two-hybrid System", Display-Systemen, "High 
Throughput Screening" oder kombinatorischen Bindungsstudien konnen 
zufallig generierte Polypeptide identifiziert werden, die an die Helicobacter 
Polypeptide der Erfindung oder deren Fragmente, oder an weitere 
erfindungsgemaS identifizierte Polypeptide binden. Wird auf diese Weise ein 
entsprechendes Peptid gefunden, kann dieses chemisch weiter modifiziert 
werden, bis die optimale mogliche Bindung erreicht ist. Das identifizierte 
Polypeptid kann z.B. als Inhibitor verwendet werden, indem es z.B. an ein 
Toxin und ein Internalisierungssignal gekoppelt wird, das den pathogenen 
Keim zerstort oder aber als Peptidmimetikum, um das Binden des Keims an 
die zellulare Oberflache zu verhindern (EP-41 2,762A und EP-B3 1 ,080A) . Mit 
Hilfe des "Two Hybrid Systems" konnen aber auch Aktivatoren des 
Immunsystems generiert werden. Die identifizierten Peptide, die an die 
Helicobacter Polypeptide der Erfindung binden, konnen hierzu an bestimmte 
Liganden z.B. fur den T-Zell-Rezeptor gekoppelt werden. Werden also einem 
von Pathogenen befallenen Tier oder Menschen diese so ausgestatteten 
Peptide verabreicht, wird das korpereigene Immunsystem spezifisch 
angelockt und aktiviert. 

Die Einhaltung der einzelnen Schritte ist hierbei nicht zwingend, sondern 
kann durch weitere Schritte erganzt bzw. ersetzt werden. 

Die jeweiligen Prototypen eines immunologischen bzw. pharmakologischen 
Wirkstoffs werden nachfolgend weiterentwickelt und verbessert. 



- 45 - 

Die Weiterentwicklung eines Impfstoffes kann dahingehend erfolgen, indem 
mehrere antigene Genprodukte oder Teile davon in einem Wirkstoff 
kombiniert werden und/oder mit verschiedenen Tragern bzw. Zusatzstoffen 
verabreicht werden. Als Tragerfungieren verschieden attenuierte bakterielle 
oder virale Organismen und als Zusatzstoffe Adjuvantien und/oder Cytokine. 

Zur Weiterentwicklung eines pharmakologischen Wirkstoffs wird eine als 
wirksam charakterisierte Leadstruktur chemisch weiter modifiziert, so daS 
eine optimale Bindung und Inhibierung des identifizierten Genprodukts 
erfolgt. Weiterhin sollte der Wirkstoff vom Patienten gut vertragen werden 
und geringe Nebenwirkungen besitzen. 

Zur Identifizierung von Wirkstoffen, die an Polynukleotide binden, kann ein 
Polynukleotid der Erfindung z.B. an eine Tragermatrix vorgekoppelt werden 
bzw. umgekehrt, die Wirkstoffe der Polypeptide- bzw. kombinatorischen 
Substanzenbank. Das verwendete darauffolgende Schema ist das gleiche 
wie das, das fur die Polypeptide schon beschrieben wurde. 

Solche inhibitorischen Substanzen konnen Polypeptide, Peptide, aber auch 
chemische Substanzen sein, wie etwa Antibiotika. Die inhibitorische 
Wirkung kann dabei in verschieden Stadien der Replikation der zu 
bekampfenden Mikroorganismen eingreifen. Beispiele sind 
Expressionsinhibitoren oder Enzyminhibitoren oder sonstige Inhibitoren, 
welche die naturliche Funktion der Polypeptide von Helicobacter und 
verwandten Mikroorganismen beeinflussen konnen. Solche inhibitorischen 
Substanzen sind ebenfalls Gegenstand der Erfindung, 

Eine weitere Moglichkeit, einen optimalen Wirkstoff gegen Helicobacter und 
andere bakterielle Infektionen zu finden, ist mit Hilfe von speziellen 
Computerprogrammen. Aufgrund von kristallographischen Daten, die von 
den in der Erfindung beschriebenen Polypeptiden gewonnen wurden kann 
ein Modell erstellt werden, das sterische, elektronische, hydrophobe und 
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sogenannten "resultierende Bindungsmomente" (RBMs) miteinander 
verbindet (Ray et al., 1998). Anhand dieses Modells konnen im weiteren 
Substanzen am Computer modelliert werden, die zwar die bereits 
identifizierten Leadstrukturen enthalten konnen, aber mit besseren 
Bindungseigenschaften ausgestattet sind. Es konnen jedoch auch vollig 
neuartige Wirkstoffe entworfen werden. 

Ein weiterer Aspekt der vorliegenden Erf indung ist eine Nukleinsaure, die fur 
ein essentielles sekretorisches Gen aus Helicobacter pylori kodiert, das 
durch das oben beschriebene erfindungsgemafce Verfahren identifiziert 
wurde. Es wurden essentielle He/icobactergene mit dem vorliegenden 
Verfahren identifiziert, deren Nukleinsauresequenzen in den SEQ ID NO. 1 
bis 113 (ungerade Zahlen) angegeben sind. Eine erfindungsgemafce 
Nukleinsaure ist beispielsweise dadurch gekennzeichnet, daG sie 

(a) eine der in SEQ ID NO: n, wobei n eine ungerade ganze Zahl von 1 
bis 1 13 einschlie&lich ist, dargestellten Nukleinsauresequenzen oder 
einen proteinkodierenden Abschnitt davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter stringenten 
Bedingungen hybridisierende Nukleotidsequenz umfaSt. 

Neben den im Sequenzprotokoll gezeigten erfindungsgemaSen 
Nukleotidsequenzen und diesen Sequenzen im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenzen umfafct die 
vorliegende Erfindung auch Nukleotidsequenzen, die mit einer der zuvor 
genannten Sequenzen hybridisieren. Der Begriff "Hybridisierung" gemafc 
vorliegender Erfindung wird bei Sambrook et al. {Molecular Cloning, A 
Laboratory Manual, Cold Spring Harbor Laboratory Press (1989), 1.101- 
1.104) verwendet. Vorzugsweise spricht man von einer stringenten 
Hybridisierung, wenn nach dem Waschen fur eine Stunde mit 1 X SSC und 
0,1% SDS bei 50°C, vorzugsweise bie 55°C, besonders bevorzugt bei 
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62°C und am meisten bevorzugt bei 68°C / insbesondere fur 1 h in 0,2 X 
SSC und 0,1 % SDS bei 55°C, vorzugsweise bei 55°C, besonders 
bevorzugt bei 62°C und am meisten bevorzugt bei 68°C noch ein positives 
Hybridisierungssignal beobachtet wird. Eine unter derartigen 
Waschbedingungen mit einer oder mehreren der erfindungsgemaBen 
Nukleotidsequenzen oder einer diesen Sequenzen im Rahmen der 
Degeneration des genetischen Codes entsprechenden Nukleotidsequenz 
hybridisierende Nukleotidsequenz ist eine erfindungsgemafte Nukleotidse- 
quenz. 

Vorzugsweise ist die erfindungsgema&e Nukleotidsequenz eine DNA. Sie 
kann jedoch auch eine RNA oder ein Nukleinsaureanalogon, wie etwa eine 
peptidische Nukleinsaure, umfassen. Besonders bevorzugt umfaSt die 
erfindungsgemalSe Nukleinsaure einen Protein-kodierenden Abschnitt der in 
Sequenzprotokoll dargestellten Nukleotidsequenzen oder eine Sequenz, die 
eine Homologie von mehr als 80 %, vorzugsweise mehr als 90 % und 
besonders bevorzugt mehr als 95 % zu den dargestellten Nukleotidse- 
quenzen oder einen vorzugsweise mindestens 20 Nukleotide (nt) und 
besonders bevorzugt mindestens 50 nt langen Abschnitt davon aufweist. 

Die Homologie wird in Prozent identischer Positionen beim Vergleich zweier 
Nukleinsauren (bzw. Peptidketten) angegeben, wobei 100% Homologie die 
vollige Identitat der verglichenen Kettenmolekiile bedeutet (Herder: Lexikon 
der Biochemie und Molekularbiologie, Spektrum Akademischer Verlag 
1995). 

Eine erf indungsgemaSe Nukleinsaure kann fur ein sekretiertes Polypeptid mit 
Signalpeptid kodieren oder fur ein sekretiertes Polypeptid ohne Signalpeptid. 

Eine erfindungsgemafce Nukleinsaure umfaSt sowohl die Sequenz des 
kodierenden Strangs als auch die dazu komplementare Sequenz. Letztere 
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kann beispielsweise bei der Herstellung von Antisense-Nukleinsauren 
Anwendung finden. 

Ebenfalls Gegenstand der Erfindung ist naturlich auch eine Genbank, die 
mindestens 2, bevorzugt mindestens 20, starker bevorzugt mindestens 1 00 
der genannten Nukleinsauren in Vektoren kloniert enthalt. 

Eine Auflistung der hierin und im Sequenzprotokoll angegebenen 
erfindungsgema&en Nukleinsauren samt ihrer Genprodukte und deren 
Funktionen und putativen Funktionen ist in den Tabellen I und II angegeben. 



Tabelle I: 
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Obligat essentielle Gene 



SEQ ID 
NO 



1+2 



3 + 4 



Gen 
(obligat 
essentiell 



HPS001 
(HPS166) 



HPC003 



Lange 



873bp 



267bp 



Mogliche Eigenschaften der 
Genprodukte 



Signalpeptidase I 



Protein der Flagellenbiosynthese 



5 + 6 



HPC005 



714bp 



Lipoprotein 



7 + 8 



HPC029 
(HPC030) 



552bp 



Sekretiertes Protein 



9+10 



HPS042 



858bp 



Inneres Membranprotein, Ubiquinol- 
Oxidoreduktase 



11 + 12 



HPC057 
(HPC109, 
HPC138) 



192bp 



Sekretiertes Protein 



13+14 



HPS062 
(HPS171) 



957bp 



Sekretiertes Protein 



15+16 



HPS065 
(HPS153) 



1629bp 



ipoprotein 



17 + 18 



HPS066 



1377bp 



Inneres Membranprotein, Eisen- 
Schwefel-Bindungsprotein 



19 + 20 



HPS068 



1533bp 



Lipase 



21+22 



23 + 24 



HPS074 



HPS083 



957bp 



480bp 



Sekretiertes Protein 



Sekretiertes / periplasmatisches Protein- 



25 + 26 



HPS084 



1983bp 



Sekretiertes / periplasmatisches Protein 



27 + 28 



HPC085 



372bp 



29 + 30 



HPC090 



Sekretiertes / periplasmatisches Protein 



558bp 



Sekretiertes / periplasmatisches Protein 



31+32 



HPS 104 



768bp 



Integrales Membranprotein 



33 + 34 



HPS115 



2367bp 



ATPase fur Kationentransport 



35 + 36 



HPS120 



2751 bp 



AuSeres Membranprotein, protektives 
Oberflachenantigen 



37 + 38 



HPS130 



990bp 



Sekretiertes Protein 



39 + 40 



HPS133 



1482bp 



Mureinvorlaufer-Protein 



41 +42 



HPC134 



600bp 



Inneres Membranprotein, Protein- 
Translokationsprotein 



43 + 44 



HPS 143 



1536bp 



Sekretiertes / periplasmatisches Protein 



45 + 46 



HPS 144 



5 40 bp 



Peptidoglykan-assoziiertes Lipoprotein 



49 + 50 



HPS152 



1062bp 



Sekretiertes / periplasmatisches Protein 



51+52 



HPS155 



2202bp 



'rotein der Flagellenbiosynthese 



53 + 54 



HPC157 
(HPC181) 



189bp 



Sekretiertes Protein 



55 + 56 



HPS183 



1008bp EisendlQABC-Transporter 



57 + 58 



HPS186 



240 bp 



Sekretiertes Protein 



59 + 60 



HPS188 



1764bp 



Aufieres Membranprotein 



61+62 



HPS 190 



1443bp 



Sekretiertes / periplasmatisches Protein 
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Tabelle II: Fakultativ essentielle Gene 



SEQ ID 
NO 


Gen 
(fakultativ 
essentiell] 


Lange 


Mogliche Eigenschaften der 

GpnnrnHulrta 


Signal 
peptid 


99+100 


HPS004 
(HPS027, 
HPS121, 
HPS131) 


1 644bp 


Inneres Membranprotein 


+ 


63 + 64 


HPC008 
(HPC1 14, 
HPC145) 


543bp 


Sekretiertes / periplasmatisches Protein 


- 


65 + 66 


HPS013 


1746bp 


2' , 3'-zvklische Nukleotid-2'- 
Phosphodiesterase 


i 

T 


67 + 68 


HPS024 
(HPS025) 


1698bp 


Chemotaxis-Protein 


_J_ 

i 


69 + 70 


HPS036 


855bp 


Sekretiertes Protein 




71+72 


HPS038 


669bp 


Sekretiertes Protein 




73 + 74 


HPS039 
(HPS147) 


804bp 


Sekretiertes Protein 




75 + 76 


HPS040 


1545bp 


Sekretiertes Protein 


+ 


77 + 78 


HPS048 


912bp 


Sekretiertes Protein 


+ 


79 + 80 


HPS050 


834bp 


Periplasmatisches Glutamin-Bindeprotein 


+ 


81+82 


HPS052 


1296bp 


AufSeres Membranprotein 




83 + 84 


HPS056 


1 197bp 


Sekretiertes Protein 




85 + 86 


HPS059 


1131bp 


Integraies Membranprotein 


+ 


87 + 88 


HPS063 


516bp 


ATP Synthase F0, Untereinheit b 


+ 


89 + 90 


HPS069 


990bp 


Sekretiertes Protein 


+ 


91 +92 


HPS091 


684bp 


Integraies Membranprotein 




93 + 94 


HPS095 


729bp 


Aufceres Membranprotein 


+ 


95 + 96 


HPS099 


975bp 


Sekretiertes Protein 




97 + 98 


HPS1 17 
(HPS 1 18, 
HPS162) 


1 290bD 


Sekretiertes Protein 


i 

T 


101 +102 


HPS132 


3063bp 


Kationenefflux Protein 


t 
\ 


47 + 48 


HPC140 
(HPC150, 
HPC179) 


1557bp 


AlpA Adhasin 


+ 


103+104 


HPS149 


2028bp 


Methylakzeptierendes 
Chemotaxisprotein 




105+106 


HPS161 


273bp 


Sekretiertes Protein 




107+108 


HPS176 


759bp 


Protein der cag Pathogenitatsinsel 




109+ 1 10 


HPS187 


1245bp 


Zinkabhangige Metalloprotease 


+ 


111 + 112 


HPS189 


1566bp ! 


Sekretiertes Protein 




113+114 


HPS191 


1782bp ! 


Sekretiertes Protein 


+ 
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Ein weiterer Aspekt der vorliegenden Erfindung ist ein Vektor, der eine 
erfindungsgema&e Nukleinsaure oder einen Abschnitt davon enthalt. Die 
Nukleinsaure oder der Nukleinsaureabschnitt kann so in den Vektor kloniert 
sein, daS sie entweder in Sense- oder Antisense Richtung exprimiert werden 
kann. Der Nukleinsaureabschnitt hat bevorzugt eine Mindestlange von 15 
Nukleotiden, starker bevorzugt 20 Nukleotiden, starker bevorzugt 50 
Nukleotiden. Dieser Vektor kann ein beliebiger prokaryontischer oder 
eukaryontischer Vektor sein, auf dem sich die erfindungsgemaSe DNA- 
Sequenz vorzugsweise in Verbindung mit Expressionssignalen befindet, wie 
z.B. Promoter, Operator, Enhancer etc. Beispiele fur prokaryontische 
Vektoren sind chromosomale Vektoren, wie etwa Bakteriophagen (z.B. 
Bakteriophage A) und extrachromosomale Vektoren wie etwa Plasmide, 
wobei zirkulare Vektoren besonders bevorzugt sind. Geeignete 
prokaryontische Vektoren sind z.B. bei Sambrook eta/., Molecular Cloning 
(1987), Kapitel 1-4, beschrieben. Andererseits kann der erfindungsgemafSe 
Vektor auch ein eukaryontischer Vektor sein, z.B. ein Hefevektor oder ein 
fur hdhere Zellen geeigneter Vektor (z.B. ein Plasmidvektor, viraler Vektor, 
Pflanzenvektor). Derartige Vektoren sind beispielsweise bei Sambrook et al., 
supra, Kapitel 16 beschrieben. CAI- und SRM-Vektoren, wie oben 
beschrieben, sind ebenfalls Gegenstand der Erfindung. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Zelle, die mit 
einem erfindungsgemaSen Vektor oder einer erfindungsgemaBen 
Nukleinsaure transformiert ist. In einer bevorzugten Ausfuhrungsform ist 
diese Zelle eine prokaryontische Zelle, vorzugsweise ein gram-negatives 
Bakterium, z.B. E.colL Andererseits kann die erfindungsgemalSe Zelle jedoch 
auch eine eukaryontische Zelle sein, wie etwa eine Pilzzelle, eine Hefezelle, 
eine tierische oder eine pflanzliche Zelle. Besonders bevorzugt handelt es 
sich bei der Zelle um einen Mikroorganismus, z.B. Helicobacter oder 
Salmonellen. Mit CAI- oder SRM-Vektoren transformierte Mikroorganismen 
sind oben bereits beschrieben worden. Diese sind, wie auch mit den obigen 
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Verfahren herstellbare Mutantenbanken, ebenfalls Gegenstand der 
Erfindung. 

Ein weiterer Aspekt der Erfindung betrifft ein essentielles und bevorzugt 
sekretiertes Polypeptid von H. pylori. Insbesondere ist dies ein Polypeptid, 
das 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl von 2 bis 
1 14 einschlieftlich ist, dargestellten Aminosauresequenzen oder 

(b) e j ne m jt einer der Sequenzen gemafc (a) immunologisch 
kreuzreagierende Sequenz umfa&t. 

Unter immunologische kreuzreagierenden Sequenzen sind somit auch 
Muteine, Varianten und Fragmente der in den SEQ ID NO. 2 bis 114 
dargestellten Sequenzen umfaSt. Darunter sind Sequenzen zu verstehen, die 
sich durch Substitution, Deletion und/oder Insertion einzelner Aminosauren 
oder kurzer Aminosaureabschnitte von den obigen Sequenzen 
unterscheiden. 

Aufgrund von Homologieanalysen mit Hilfe des FASTA Proteinprogramms 
konnten den identifizierten Polypeptides deren Sequenz mit der 
Nukleinsauresequenz gefunden werden konnte, bestimmte Merkmale bzw. 
eine mutmafcliche Lokalisation im Bakterium zugewiesen werden. Einige der 
von den erfindungsgemafcen Nukleinsauren kodierten Polypeptide besitzen 
ein Signalpeptid und werden durch den Sec-abhangigen Transport- 
mechanismus an ihre Zielstelle exportiert, wahrend andere kein Signalpeptid 
besitzen und daher wahrscheinlich uber einen Sec-unabhangigen 
Transportmechanismus, z.B. durch das ABC-Transporter-System, sekretiert 
werden (siehe Tabellen I und II). 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung der 
erfindungsgemalSen Polypeptide und -fragmente. Die Herstellung von 
erfindungsgemafcen Polypeptiden erfolgt vorzugsweise dadurch, daft man 
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eine Zelle mit einem erfindungsgemaBen DNA-Molekul oder Vektor 
transformiert, die transformierte Zelle unter Bedingungen kultiviert, bei 
denen eine Expression des Polypeptids stattfindet, und das Polypeptid aus 
der Zelle oder/und aus dem Kulturiiberstand isoliert. Dabei kann das 
erfindungsgemaBe Polypeptid sowohl als Fusionspolypeptid als auch als 
Nichtfusionspolypeptid gewonnen werden. 

Das erfindungsgemaBe Polypeptid kann als Immunogen zur Herstellung von 
Antikorpern verwendet werden. 

Die vorliegende Erfindung betrifft somit auch einen Antikorper, der gegen 
ein erfindungsgemaBes Polypeptid gerichtet ist. Ebenfalls Gegenstand der 
Erfindung sind Fragmente solcher Antikorper, wie z.B. Fab-Fragmente oder 
Fc-Fragmente. 

Noch ein weiterer Aspekt der Erfindung ist ein Inhibitor der 
erfindungsgemaBen Polypeptide, deren Fragmente, bzw. deren Expression, 
Presentation oder/und naturlichen Funktion. Dies ist bevorzugt ein Molekiil, 
welches in der Lage ist, spezifisch an ein Polypeptid oder Fragment davon 
zu binden oder/und dessen Expression, Presentation oder/und naturliche 
Funktion zu beeinflussen. Die Identifizierung von solchen spezifischen 
Bindepartnern wurde oben bereits beschrieben. Besonders geeignet als 
Inhibitoren sind Proteine oder Peptide, die ein erfindungsgemaBes Polypeptid 
in seinen naturlichen Funktion hemmen, z.B. konnen Enzyme durch 
Blockieren des aktiven Zentrums gehemmt werden. 

Noch ein weiterer Aspekt der vorliegenden Erfindung betrifft eine 
pharmazeutische Zusammensetzung, die als Wirkstoff ein 
erfindungsgemaBes DNA-Molekul, einen erfindungsgemaBen Vektor, eine 
erfindungsgemaBe Zelle, ein erfindungsgemaBes Polypeptid, einen 
erfindungsgemaBen Antikorper oder Fragment davon oder/und ein 
inhibitorisches Molekul, das in der Lage ist, spezifisch an ein 
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erfindungsgemaSes Polypeptid zu binden, gegebenenfallszusammen mitub- 
lichen pharmazeutischen Hilfs-, Verdunnungs-, Zusatz- und Tragermitteln 
enthalt. 

Eine erfindungsgema&e pharmazeutische Zusammensetzung kann auf ver- 
schiedene Art und Weise und unter Verwendung einzelner ihrer Bestandteile 
als wirksame Substanzen zur Hemmung der Reproduktion von Helicobacter 
Organismen in einem Wirt, speziell im Menschen verwendet werden. 

Die erfindungsgemaBe pharmazeutische Zusammensetzung kann einerseits 
zur Diagnostik einer He/icobacter-lnfekt'ion verwendet werden. Die 
Diagnostik auf Nukleinsaureebene erfolgt vorzugsweise durch Verwendung 
von Hybridisierungssonden, bzw. Primern, welche eine spezifische DNA- 
Sequenz aufweisen, die zu mindestens einen Abschnitt einer der in SEQ ID 
NO. 1 bis 1 1 3 (ungerade Zahlen) dargestellten Sequenzen komplementar ist, 
so dalS sie eine Amplifikation der erfindungsgemafcen Sequenzen erlauben. 
Wir bereits erwahnt, konnen diese Amplifikationsprimer oder Sonden auch 
zur Amplifikation und damit zur Detektion von verwandten Mikroorganismen 
verwendet werden, wenn diese Gensequenzen aufweisen, die fur dasselbe 
essentielle Gen kodieren. Auf Proteinebene erfolgt die Diagnostik 
vorzugsweise mit Hilfe der erfindungsgema&en Antikdrper. 

Des weiteren ist die pharmazeutische Zusammensetzung zur Prophylaxe und 
Bekampfung von //e//co6acfer-lnfektionen und Infektionen mit verwandten 
Mikroorganismen geeignet. 

Ein weiterer wichtiger Aspekt der vorliegenden Erfindung ist die 
Verwendung der identifizierten essentiellen Gene von Helicobacter pylori zur 
Prevention oder Bekampfung einer Infektion mit Helicobacter oder 
verwandten Mikroorganismen. Insbesondere konnen diese identifizierten 
essentiellen Gene zur Herstellung von Impfstoffen (Vakzinen) verwendet 
werden (siehe oben). 
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Eine weitere Verwendung der Polypeptide der Erfindung besteht in der 
Aufreinigung der Antikorper gegen H. pylori Polypeptide und gegen 
entsprechende Polypeptide aus verwandten und anderen Mikroorganismen. 

Die Erfindung wird durch die nachfolgenden Beispiele, Abbildungen und das 
Sequenzprotokoll naher erlautert. Im Sequenzprotokoll sind die folgenden 
Nukleinsaure- und Aminosauresequenzen dargestellt. 

Abbildung 1 zeigt eine schematische Darstellung eines CAI-Vektors. 

Abbildung 2 zeigt eine schematische Darstellung eines Verfahrens der 
konditionalen Antisense-Hemmung (CAI). 

Abbildung 3 zeigt eine schematische Darstellung der Untersuchung der 
Lebendfahigkeit von defizienten Mikroorganismen anhand ihrer 
Uberlebensraten mit Hilfe des CIA-Verfahrens. 

Abbildung 4 zeigt eine schematische Darstellung des subtraktiven CAI- 
Verfahrens (CAI). 



Abbildung 5 zeigt eine schematische Darstellung eines SRM-Vektors. 

Abbildung 6 zeigt eine schematische Darstellung der reversiblen 
Inaktivierung eines Gens durch die Insertion/Excision eines 
konditional replizierenden SRM-Plasmids. 

Abbildung 7 zeigt eine schematische Darstellung eines SRM-Verfahrens. 

Abbildung 8 zeigt eine schematische Darstellung der Anreicherung von 
Fragmenten essentieller Gene durch subtraktive Hybridisierung. 



Beisptele 
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Die Anwendung des dargestellten Gesamtverfahrens ist exemplarisch am 
Beispiel des Pathogens Helicobacter dargestellt, laSt jedoch auch mit 
anderen pathogenen Keimen durchfuhren. 

1 . Identifizierung essentieller Gene pathogener Mikroorganismen 

Schritt 1 

Anreicherung von H. pylori Genen kodierend fur sekretorische/exkretorische 
Polypeptide 

Hersteliung einer H. pylori Genbank im Minimalvektor pMin2: Als 
Ausgangsstamm dient der H. pylori Wildtyp Stamm 69A. Die Bakterien 
werden auf Serumplatten oder einem anderen adaquaten Medium 
(Westblom et al., 1991) bei einer Temperatur von 37°C in einer 
Atmosphare von 5% 0 2/ 10% C0 2/ 85% N 2 angezuchtet. Die Isolierung der 
chromosomalen DNA erfolgt nach der Methode von Leying et al., (1992), 
wobei die DNA anschlieSend uber einen Casium-Chlorid-Gradienten 
aufgereinigt wird. 50 pg der gereinigten, chromosomalen DNA wird mit den 
Restriktionsendonukleasen Sau3A und HpaW partiell gespalten, die DNA 
Fragmente in einem Agarosegel aufgetrennt und die Fragmente in einer 
GrolSe von 3 bis 6 kbp aus dem Gel mit Hilfe des Geneclean II Kits (Biol 01 ) 
eluiert. Die isolierten DNA-Fragmente werden in den BglW und Cla\ 
geschnittenen pMin2-Vektor (Kahrs et al., 1995) kloniert und uber 
Elektroporation in den F. co//- Stamm E181 transformiert, dem zuvor das 
Plasmid pTnMax9 ubertragen wurde. Insgesamt werden uber einen solchen 
Ansatz ca. 4000 Klone generiert. Der £.co//-Stamm E181 ist ein Derivatdes 
Stammes HB101 (Boyer und Roulland-Dussoix, 1969) und enthalt den 
lysogenen-Phagen CH616 zur Replikation des pTn/Vfax9-Plasmids. 
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Serumplattenrezeptur: 

36 g GC-Agar (Basis) in 910 ml Aqua dest. suspendieren und autoklavieren 
auf ca. 45°C abkuhlen lassen 
Zugabe von 10 ml Vitaminmix 

Zugabe von jeweils 1 ml der Antibiotikastammldsung: 

Vancomycin (10 mg/l in Aqua bidest) 

Nystatin (0,793 mg/l in DMF*) 

Trimethoprim (5 mg/l in DMF*) 

Amphotericin (5 mg/l in DMF*) 
* DMF = Dimethylformamid 
Zugabe von 90 ml Serum oder 
Zugabe von 8% Pferdeblut = 80 ml 
oder gleiche Menge Humanblut 

Antibiotika Stammlosung 

Vancomycin 100 mg in 10 ml Aqua bidest 

Nystatin 7,93 mg in 10 ml DMF (je 1 ml pro Liter GC-Agar 



zusetzen) 



Trimethoprim 
Amphotericin 
(Lagerung im 



50 mg in 10 ml DMF 
50 mg in 10 ml DMF 
Kuhlschrank bis max. 8 Wochen) 



Vitaminmix (Konzentrat) 



Dextrose (D-Glucose) 100 g 

L-Glutamin 10 g 

Cystein HCI (C 3 H 7 N0 2 S x HCI x H 2 0) 26 g 



Cocarboxylase 100 mg 

Fe (N0 3 ) 3 20 mg 



Aquabidest. losen 



in 50 ml 



Thiamin HCI 



3 mg 
250 mg 



DPN NAD 



Vitamin B 



12 



10 mg 
1.1 9 



L-Cystein (C 6 H 12 N 2 0 4 S 2 ) 
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Adenin 



Guanin CI 



1,0 g in 15 ml HCI 

30 mg (32%ig) losen 



L-Arginin HCI 
p-Aminobenzoesaure 



Uracil 



500 mg 
150 mg 
13 mg 



(sterilfiltrieren, in 10 ml Portionen abfullen und einfrieren) 

Genetische Anreicheruna sekretorischer/exkretorischer H. pylori 
Genprodukte: Das auf pTn/Wax9 liegende Transposon JnMaxQ ist mit dem 
genetischen Marker S-Lactamase ausgestattet. Dieser Marker ist auf dem 
Transposon so angelegt, date damit die Selektion erfolgreicher Transposon- 
Insertionen ermoglicht wird, wenn dieses im korrekten Leserahmen solcher 
Gene vorliegt, deren Produkte von £.co//-Stamm E145 rif sekretiert bzw. 
exportiert werden. Die Insertion des Transposons in ein solches Gen fuhrt 
zu einer Genfusion zwischen dem Zielgen und dem Marker, wobei durch ein 
im Zielgen determiniertes Sekretions- und/oder Exportsignal das 
Fusionsprotein aus der Zelle geschleust wird und die Aktivitat des integralen 
Reportergens entfaltet wird. Im Fall der fc-Lactamase konnen die Klone 
direkt uber die Entwicklung einer Resistenz gegen Ampicillin nachgewiesen 
werden. Das TnMax9 Transposon auf pTnMax9 wird uber IPTG aktiviert. 

Die Transposon-Mutagenese der Genbank wird in Pools von bis zu 20 
Einzelklonen durchgefuhrt. Die jeweiligen Pools weren auf LB-Platten 
ausplattiert, die mit 100/yM IPTG, 15//g/ml Chloramphenicol und 15/yg/ml 
Tetrazyklin versetzt sind. In einem zweiten Schritt werden die TnMax9 
mutagenisierten pMin2-Plasmide uber Konjugation in den E.co/i Stamm 
E145 rif uberfuhrt, da diese mit einem entsprechenden mob-Signal (or/7) 
ausgestattet sind. Die pTnMax9-Plasmide werden dagegen nicht ubertragen. 
Folglich kommt es in £.co//E1 45 rif zu einer spezifischen Vervielfaltigung der 
mutagenisierten pMin2 Genbank. Die entsprechenden Transkonjuganten 
werden auf LB-Medium mit 1 5 //g/ml Chloramphenicol, 1 5 //g/ml Tetrazyklin 
und 100 /ig/ml Rifampicin selektioniert. Insgesamt werden 500 bis 1000 
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Transkonjuganten in 2 ml LB-Medium zusammengefa&t und in 
entsprechenden Verdunnungen (10' 1 bis 10~ 2 ) auf LB-Platten angezuchtet, 
die mit 50//g/ml Ampicillin versetzt sind. Nach einer Kultivierung der Platten 
uber 36 Stunden bei 37°C erhalt man im gesamten Ansatz 200 bis 300 
Ampicillin-resistente Klone mit Transposon inserierten Plasmiden. 

Schritt 2 

Herstellung Gen-defizienter H. pylori, die in sekretorische/exkretorische 
Polypeptide kodierende Gene mutiert sind und die Identifizierung solcher 
Gene mit essentieller biologischer Funktion. 

Herstellung Gen-defizienter H. pylori Mutanten: Durch Einbringung der 
gewonnenen Plasmide mit den TnMax9-mutierten H. pylori Genen, kodierend 
fur sekretierte/exkretierte Polypeptide in einen H. pylori Wildtyp Stamm 
konnen Gen-spezifische Mutanten erzeugt werden. Bedingt durch die 
klonierten H. pylori Gensequenzen auf den Plasmiden kommt es im Falle 
eines doppelten homologen Rekombinationsereignisses zu der genomischen 
Insertion des TnMax9-Transposons in das chromosomale Zielgen und damit 
zu dessen Inaktivierung. Durch den genetischen Marker auf dem Transposon 
kann dieser Vorgang selektioniert werden, da das pMin2 Plasmid in H. pylori 
nicht repliziert wird. 

In der Durchfuhrung wird der /V.py/o/7 Wildtyp Stamm 69A in Einzelansatzen 
mit den gewonnenen individuellen Plasmiden transformiert, wobei die 
naturliche Kompetenzdes Bakteriums, DNA aufzunehmen, ausgenutzt wird. 
Entsprechend den Standard Kultivierungsbedingungen werden die Bakterien 
in BHI-Medium aufgenommen und bis zu einer optischen Dichte bei 550 nm 
von 0,1 bei 37°C unter mikoraerophilen Bedingungen angezuchtet. Die 
einzelnen Kulturansatze werden jeweils mit 200 bis 599 ng gereinigte 
Plasmid-DNA versetzt und die Kultur uber Nacht fortgesetzt. 
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Charakterisierung der biologischen Funktion der Gen-defizienten H. pylori 
Mutanten im Wachstumstest: Die einzelnen Ansatze werden nach der 
Kultivierung auf Serumplatten ausplattiert, welche mit 4 //g/ml 
Chloramphenicol versetztsind. Hinsichtlichder Wachsumseigenschaften der 
einzelnen Mutanten im Vergleich zum Wildtyp Stamm konnen 3 Kategorien 
unterschieden werden: (1) Mutanten, die nicht wachsen; (2) Mutanten, die 
kleinere Kolonien ausbilden; (3) Mutanten, die eine normale KoloniegroSe 
entwickeln. Diese Ergebnisse konnen fur jedes Ausgangsplasmid 
reproduzierbar erzielt werden. Zur eindeutigen Beurteilung der biologischen 
Bedeutung der Gen-defizienten Mutanten der Kategorie 1 werden diese dem 
CAI-Verfahren zugefuhrt. Die Gen-defizienten Mutanten der Kategorie 2 und 
3 werden in den anderen biologischen Testsystemen analysiert. 

Schritt 3 

Ermittlung der Identitat der H. pylori Gene kodierend fur 
sekretorische/exportierte Polypeptide. 

Zur Ermittlung der Primarstruktur der identifizierten H. pylori Gene, werden 
die jeweiligen Ausgangsplasmide aus dem E.coli Stamm verwendet. Die 
Plasmide werden aus diesen Stammen isoliert und die Nukleotidsequenz der 
Zielgene durch Sequenzierung der Bereiche oberhalb und unterhalb der 
Insertionsstelle des Transposons im Zielgen bestimmt. Das Leseraster des 
Zielgens kann direkt ermittelt werden, da das Transposon-kodierte S- 
Laktamase Gen eine aktive Fusion mit dem Genprodukt des Zielgens eingeht 
(s.o.). Die Sequenzierung wird mit Hilfe eines ABI-Sequenz-Automaten nach 
Angaben des Herstellers mit folgenden Sequenzprimern durchgef uhrt: M 1 3- 
F (GTAAAACGACGGCCAGT) und M13-RP1 (CAGG AAACAGCTATG ACC) . 
Zur weiteren Charakerisierung der Gene wird die Datenbank Genebank des 
GCG-Programms herangezogen, z.B. zur Identifizierung bekannter, 
homologer Gene anderer Mikroorganismen (FASTA), zur Identifizierung 
potentieller Signalpeptidbereiche (SPSCAN) oder zur Identifizierung von 
Lipoproteinen (MOTIFS). 
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Bei einem Teil der charakterisierten Klone konnte nicht die vollstandige 
Gensequenz ermittelt werden, da das klonierte DNA-Fragment nicht das 
gesamte Gen enthielt. Das verfugbare DNA-Fragment wird dazu eingesetzt, 
urn aus der Original-Genbank ein DNA-Fragment mit vollstandigen Gen zu 
5 isolieren. Aus diesen Klonen konnen dann mit einem Gen-spezifischen 
Primer und einem Vektor-spezifischen Primer die fehlenden Gensequenzen 
amplifiziert und anschlieSend direkt sequenziert werden. 
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Anspruche 

Verfahren zur Bereitsteilung von Mitteln zum Nachweis, zur 
Prevention oder/und zur Therapie von mikrobiellen Infektionen, 
dadurch gekennzeichnet, 
date es die Schritte umfafct: 

(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendef izienter 
Mikroorganismen durch konditionale Antisense-Hemmung 
(CAI)oder/undsubtraktiveRekombinations-Mutagenese(SRM) 
und Bestimmung der Lebens- oder/und Oberlebensfahigkeit der 
gendefizienten Mikroorganismen in einem Testsystem. 

(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung 
der Mikroorganismen oder verwendeter Mikroorganismen 
herbeifuhren. 

(C) Testen der identifizierten Wirkstoffe auf ihre Anwendbarkeit 
als Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

Verfahren nach Anspruch 1, 
dadurch gekennzeichnet, 

da& obligat essentielle Gene durch CAI identifiziert werden. 

Verfahren nach Anspruch 1, 
dadurch gekennzeichnet, 

daS fakultativ essentielle Gene durch SRM identifiziert werden. 
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Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennz ichnet, 

dafc vor Schritt (A) eine Selektion auf Gene durchgefuhrt wird, die fur 
Polypeptide mit einer bestimmten Funktionalitat kodieren oder/und die 
fur Polypeptide kodieren, die in einer bestimmten Entwicklungsstufe 
exprimiert werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS die Selektion mit Hilfe von Hybridisierungsverfahren durchgefuhrt 
wird, ausgewahlt aus Subtraktions- und Array- Verfahren. 

Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

date die Selektion auf spezifische subtrahierte apathogene oder 
pathogene Gene durchgefuhrt wird. 

Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

date die Selektion auf spezifische subtrahierte Gene von H. pylori oder 
H.heilmannii durchgefuhrt wird. 

Verfahren nach einem der Anspruche 4 bis 7, 
dadurch gekennzeichnet, 

daS fur exportierte Polypeptide kodierende Gensequenzen selektiert 
werden. 

Verfahren nach einem der Anspruche 4 bis 8, 
dadurch gekennzeichnet, 

daS fur sekretierte Polypeptide kodierende Gensequenzen selektiert 
werden. 
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Verfahren nach einem der Anspruche 4 bis 9, 
dadurch gekennzeichnet, 

daB fur Polypeptide kodierende Gene selektiert werden, welche zur 
Entwicklung der vitalen Form aus der Uberdauerungsform notwendig 
sind, 

Verfahren nach einem der Anspruche 4 bis 9, 
dadurch gekennzeichnet, 

daB fur Polypeptide kodierende Gene selektiert werden, welche zur 
Entwicklung der Uberdauerungsform aus der vitalen Form notwendig 
sind. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

dalS in Schritt (A) zur Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen 
Testsysteme, ausgewahltaus//7-wfro-Systemen, Zellkultursystemen, 
Gewebekultursystemen und Tiermodellen als naturliche Umgebung 
verwendet werden. 

Verfahren nach Anspruch 12, 
dadurch gekennzeichnet, 

dafc diejenigen defizienten Gensequenzen, welche zu nicht 
kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 
gendefizienten Mikroorganismen fuhren, der Kategorie der obligat 
essentiellen Gene zugeordnet werden. 

Verfahren nach Anspruch 12, 
dadurch gekennzeichnet, 

daB diejenigen defizienten Gensequenzen, welche zu kultivierbaren 
aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
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Mikroorganismen fiihren, der Kategorie der fakultativ essentiellen 
Gene zugeordnen werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB die identifizierten Gene zur Herstellung von Primern verwendet 
werden, mit Hilfe derer entsprechende Gene aus verwandten 
Mikroorganismen, Subspezies oder/und Arten identifiziert werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

date in Schritt (B) spezifische Wirkstoffe identifiziert werden, welche 
die Expression, Presentation oder/und Funktion der essentiellen 
Polypeptide beeinflussen, insbesondere immunologisch wirksame 
Substanzen, Bindepartner der Polypeptide oder deren Fragmente 
oder/und inhibitorische Substanzen. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS Schritt (B) eine Bestimmung des immunogenen Potentials der 
Polypeptide oder/und deren Fragmente umfaSt, wobei die 
identifzierten Gene exprimiert werden und anschlieSend eine 
Western-Blot-Analyse durchgefuhrt wird oder/und daB mit den 
identifzierten Polypeptiden oder Fragmenten davon eine Vakzinierung 
in Zellkultur oder im Tiermodell durchgefuhrt und die Auslosung einer 
spezifischen Immunreaktion beobachtet wird. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

date Schritt (B) eine Bestimmung des Bindungspotentials der 
Polypeptide oder deren Fragmente durch Screening von 
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Substanzenbibliotheken, Oberflachendisplayverfahren, kristallo- 
graphische Analyse oder/und Computer-Modelling umfaSt. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

da(3 die diagnostischen, praventiven oder/und therapeutischen Mittel 
in Form von passiven Impfstoffen oder aktiven Impfstoffen 
bereitgestellt werden. 

Verfahren nach Anspruch 19, 
dadurch gekennzeichnet, 

dalS die passiven Impfstoffe in Form von Antikorpern oder/und 
Antikorperfragmenten und die aktiven Impfstoffe in Form von 
heterologen Tragersystemen oder/und in Form von Antigenen, 
Antigenfragmenten, Subunit-Vakzinen, Lebendvakzinen, DNA- 
Vakzinen oder/und Lebensmittelvakzinen bereitgestellt werden. 

Verfahren nach einem der vorhergehenden Anspruche 1 bis 1 9, 
dadurch gekennzeichnet, 

da& die diagnostischen, praventiven oder/und therapeutischen Mittel 
inhibitorische Substanzen umfassen, insbesondere Expressionsinhibi- 
toren oder/und Enzyminhibitoren. 

Verfahren zur Identifizierung essentieller mikrobieller Gene, 
dadurch gekennzeichnet, 
da(5 es die Schritte umfaSt: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i), 

(iii) Identifizieren eines proteinkodierenden Abschnitts einer 
mikrobiellen DNA-Sequenz, in der die gendefizienten 
Mikroorganismen defizient sind. 
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(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur 
die Uberlebensfahigkeit sind. 



23. Verfahren nach Anspruch 22, 
5 dadurch gekennzeichnet, 

dafc die gendefizienten Mikroorganismen hergestellt werden, indem 
ein DNA-Abschnitt in einem mikrobiellen Genom mutagenisiert wird. 



24. Verfahren nach anspruch 22, 
10 dadurch gekennzeichnet, 

dafcder DNA-Abschnittdurch Transposon-Mutagenese mutagenisiert 
wird. 

25. Verfahren nach Anspruch 23, 
15 dadurch gekennzeichnet, 

da& die Mutagenisierung des DNA-Abschnitts auf dem mikrobiellen 
Genom durch homologe Rekombination erfolgt. 



26. Verfahren nach Anspruch 25, 
20 dadurch gekennzeichnet, 

dafc das SRM-Verfahren angewendet wird. 



27. Verfahren nach Anspruch 23, 
dadurch gekennzeichnet, 

25 daB die gendefizienten Mikroorganismen hergestellt werden, indem 

in Mikroorganismen ein DNA-Abschnitt oder eine Teilsequenz davon 
in Form von Antisense-RNA exprimiert wird. 



28. 

30 



Verfahren nach Anspruch 27, 

dadurch gekennzeichnet, 

da(S das CAI-Verfahren angewendet wird. 
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Verfahren nach einem der Anspruche 22 bis 28, 
dadurch g k nnzeichnet, 

dafc zur Bestimmung der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen Testsysteme ausgewahlt aus In- 
wYro-Systemen, Zellkultursystemen, Gewebekultursystemen und 
Tiermodellen als naturliche Umgebung verwentfet werden. 

Verfahren nach Anspruch 29, 
dadurch gekennzeichnet, 

daS diejenigen defizienten Gensequenzen, welche zu nicht 
kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 
gendefizienten Mikroorganismen fuhren, der Kategorie der obligat 
essentiellen Gene zugeordnet werden. 

Verfahren nach Anspruch 29, 
dadurch gekennzeichnet, 

dalS diejenigen defizienten Gensequenzen, welche zu kultivierbaren 
aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
Mikroorganismen fuhren, der Kategorie der fakultativ essentiellen 
Gene zugeordnet werden. 

Verfahren nach einem der Anspruche 22 bis 31, 
dadurch gekennzeichnet, 

dafcdas Identifizieren des proteinkodierenden DNA-Abschnitts durch 
Expression in einem Wirtsorganismus und Nachweis des 
Vorhandenseins eines Expressionsproduktes erfolgt. 

Verfahren nach einem der Anspruche 32 bis 32, 
dadurch gekennzeichnet, 
dalS es weiterhin umfaSt: 

(v) Herstellen von Primern zur Amplifikation und Detektion von 
homologen Gensequenzen in heterologen Mikroorganismen 
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(vi) Identifizieren der homologen Gensequenzen. 



jo 



34. Nukleinsaure, kodierend fur ein essentielles sekretorisches Gen aus 
Helicobacter, identifiziert durch das Verfahren nach einem der 
Anspruche 22 bis 33. 

35. Nukleinsaure nach Anspruch 34, 
dadurch gekennzeichnet, 

dalS sie fur ein sekretiertes Polypeptid mit Signalpeptid kodiert. 

36. Nukleinsaure nach Anspruch 34, 
dadurch gekennzeichnet, 

dafS sie fur ein sekretiertes Polypeptid ohne Signalpeptid kodiert. 

15 37. Nukleinsaure, 

dadurch gekennzeichnet, 

daft sie 

(a) eine der in SEQ ID NO: n, wobei n erne ungerade ganze Zahl 
von 1 bis 113 einschlieSlich darstellt, dargestellten 

20 Nukleinsauresequenzen, oder einen proteinkodierenden 

Abschnitt davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter 
25 stringenten Bedingungen hybridisierende Nukleotidsequenz 

umfa&t. 



38. 

30 



Genbank, umfassend mindestens zwei Nukleinsauren nach einem der 
Anspruche 34 bis 37. 
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39. Vektor, 

dadurch gekennzeichnet, 

dafc er mindestens eine Nukleinsaure nach einem der Anspruche 34 
bis 37 oder einen Abschnitt davon enthalt. 

40. Vektor nach Anspruch 39, 
dadurch gekennzeichnet, 
date er ein CAI-Vektor ist. 



41 . Vektor nach Anspruch 39, 
dadurch gekennzeichnet, 
daS er ein SRM-Vektor ist. 



42. Zelle, 

dadurch gekennzeichnet, 

daS sie mit einer Nukleinsaure nach einem der Anspruche 34 bis 37 
oder einen Vektor nach einem der Anspruche 39 bis 41 transformiert 
ist. 



43. Mutantenbank, 
dadurch gekennzeichnet, 

daft sie aus mindestens zwei Mikroorganismen besteht, die mit einem 
Vektor nach Anspruch 40 oder einem Vektor nach Anspruch 41 
transformiert sind. 

44. Polypeptid, 

dadurch gekennzeichnet, 

da& es von einer Nukleinsaure nach einem der Anspruche 34 bis 37 
kodiert ist. 
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45. Polypeptid nach Anspruch 44, 
dadurch gekennzeichnet, 

dalS es 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl 
von 2 bis 114 einschlieSlich darstellt, dargesteflten 
Aminosauresequenzen oder 

(b) eine mit einer der Sequenzen gemafc (a) immunologisch 
kreuzreagierende Sequenz umfafct. 



io 46. Polypeptid nach Anspruch 45, 
dadurch gekennzeichnet, 

daS es ein essentielles sekretiertes Polypeptid ist. 



47. Polypeptidfragment, 

!5 dadurch gekennzeichnet, 

daS es einen immunogenen Abschnitt einer der Sequenzen nach 
Anspruch 45 aufweist. 

48. Inhibitorisches Molekul, erhaltlich durch das Verfahren nach 
20 Anspruch 1, 

dadurch gekennzeichnet, 

dafc es in der Lage ist, spezifisch an ein Polypeptid oder Fragment 
davon nach einem der Anspruche 44 bis 47 zu binden oder/und 
dessen Expression, Presentation oder/und natiirliche Funktion zu 
25 beeinflussen. 



49. Verfahren zur Herstellung eines Polypeptids oder Polypeptidfragments 
nach einem der Anspruche 44 bis 47, 
dadurch gekennzeichnet, 

dafc man eine Zelle mit einer Nukleinsaure nach einem der Anspruche 
34 bis 37 oder einem Vektor nach. Anspruch 39 transformiert, die 
transformierte Zelle unter Bedingungen kultiviert, bei denen eine 
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Expression des Polypeptids stattfindet und das Polypeptid aus der 
Zelle oder/und dem Kulturuberstand isoliert. 



50. Verwendung eines Polypeptids oder eines Fragmentes davon nach 
einem der Anspruche 44 bis 47 davon als Immunogen zur Erzeugung 
von Antikorpern. 

51 . Antikorper oder Fragment davon, 
dadurch gekennzeichnet, 

^° daR er spezifisch ist fur ein Polypeptid oder ein Fragment davon nach 

einem der Anspruche 44 bis 47. 

52. Pharmazeutische Zusammensetzung, 
dadurch gekennzeichnet, 

is dalS sie als Wirkstoff 

a) eine Nukleinsaure nach einem der Anspruche 34 bis 37, 

b) einen Vektor nach Anspruch 39, 

c) eine Zelle nach Anspruch 42, 

d) ein Polypeptid oder ein Fragment davon nach einem der 
20 Anspruche 44 bis 47, 

e) einen Antikorper oder Fragment davon nach Anspruch 51 
und/oder 

f) ein inhibitorisches Molekiil nach Anspruch 48, 
gegebenenfalls zusammen mit ublichen pharmazeutischen Hilfs-, 

25 Verdunnungs-, Zusatz- und Tragermitteln, enthalt. 

53. Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Diagnostik, Prevention oder/und Therapie einer 
He/icobacter-\nf ektlon. 



30 



54. Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Hemmung der Reproduktion von Helicobacter- 
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Organismen und/oder anderen anthrogenen Mikroorganismen in 
einem Wirt. 

Verwendung nach Anspruch 54, 
dadurch gekennzeichnet, 

daft eine Nukleinsaure nach einem der Anspruche 34 bis 37 als DNA- 
Vakzin formuliert wird. 

Verwendung nach Anspruch 54, 
dadurch gekennzeichnet, 

daft ein Polypeptid oder Polypeptidfragment nach einem der 
Anspruche 44 bis 47 als Subunit-Vakzin oder als Lebendvakzin 
formuliert wird. 

Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Herstellung eines Mittels fur die Diagnostik, 
Prevention oder/und Therapie einer A/e/Zco^acter-lnfektion. 
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Zusammenfassung 



Die vorliegende Erfindung betrifft Verfahren zur Bereitstellung von 
therapeutischen, praventiven oder/und diagnostischen Mitteln gegen 
mikrobielle Infektion und zur Identifizierung und Charakterisierung 
essentieller Gene aus Helicobacter pylori. Weiterhin betrifft sie die 
identifizierten Nukleinsauren, welche fur die essentiellen Genprodukte 
kodieren, und die davon kodierten Polypeptide. 
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SEQUENZ PROTOKOLL 

(1) ALLGEME I NE ANGABEN: 

(i) ANMELDER: 

(A) NAME: CREATOGEN Biosciences GmbH 

(B) STRASSE: Ulmer Strasse 160 a 

(C) ORT: Augsburg 

(E) LAND : DE 

(F) POSTLEITZAHL: 86156 

(A) NAME: Max- Planck-Gesellschaf t zur Foerderung der 

Wissenschaf ten e.V. 

(B) STRASSE: Hof gartenstrasse 2 

(C) ORT: Muenchen 

(E) LAND: DE 

(F) POSTLEITZAHL: 80539 

(ii) BEZEICHNUNG DER ERFINDUNG: Helicobacter-Proteine zur 
Identif izierung, 

Entwicklung und Optimierung von immunologischen und 
pharmakologischen Wirkstoffen 

(iii) ANZAHL DER SEQUENZEN: 114 

(iv) COMPUTER- LESBARE FAS SUNG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS -DOS 

(D) SOFTWARE: Patent In Release #1.0, Version #1.3 0 

(EPA) 

(2) ANGABEN ZU SEQ ID NO: 1: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 873 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 

(vii) UNM I TTELBARE HERKUNFT: 

(B) CLON(E): HPS001 (HPS166) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .873 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 1: 

ATG AAA TTT TTA CGC TCT GTT TAT GCA TTT TGC TCC AGT TGG GTA GGG 4 8 

Met Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
1 5 10 15 
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ACG ATT GTT ATT GTG CTG TTG GTT ATC TTT TTT ATC GCG CAA GCC TTT 96 
Thr lie Val lie Val Leu Leu Val lie Phe Phe lie Ala Gin Ala Phe 
20 25 30 

ATC ATT CCC TCT CGC TCT ATG GTT GGC ACG CTC TAT GAG GGC GAC ATG 144 
lie lie Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 40 45 

CTC TTT GTC AAA AAG TTT TCT TAC GGC ATA CCC ATT CCT AAA ATC CCA 192 
Leu Phe Val Lys Lys Phe Ser Tyr Gly lie Pro lie Pro Lys lie Pro 
50 55 so 

TGG ATT GAG CTT CCT GTT ATG CCT GAT TTT AAA AAT AAC GGA CAT TTG 24 0 

Trp lie Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

ATA GAG GGG GAT CGC CCT AAG CGT GGC GAA GTG GTG GTG TTT ATC CCT 288 
lie Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe lie Pro 
85 90 95 

CCC CAT GAA AAA AAG TCT TAC TAT GTT AAA AGG AAT TTT GCC ATT GGA 336 
ro His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala lie Gly 
100 105 110 

GGC GAT GAG GTG TTG TTC ACT AAT GAG GGT TTT TAT TTG CAC CCT TTT 3 84 

Gly Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
115 120 125 

GAG AGC GAC ACG GAC AAA AAT TAC ATC GCT AAA CAT TAC CCT AAC GCC 432 
Glu Ser Asp Thr Asp Lys Asn Tyr lie Ala Lys His Tyr Pro Asn Ala 
130 135 140 

ATG ACA AAA GAA TTT ATG GGT AAA ATT TTT GTT TTA AAC CCT TAT AAA 480 
Met Thr Lys Glu Phe Met Gly Lys lie Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

AAT GAG CAT CCG GGT ATC CAT TAC CAA AAA GAC AAT GAA ACC TTC CAC 52 8 

Asn Glu His Pro Gly lie His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

TTA ATG GAG CAA TTA GCC ACT CAA GGC GCA GAA GCT AAT ATC AGC ATG 576 
Leu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn lie Ser Met 
180 185 190 



CTC ATT CAA ATG GAG GGC GAA AAG GTG TTT TAT AAG AAA ATC AAT 624 
Gin Leu lie Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys lie Asn 
195 200 205 

GAC GAT GAA TTT TTC ATG ATC GGC GAC AAC AGA GAC AAT TCT AGC GAC 672 
Asp Asp Glu Phe Phe Met lie Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 

TCG CGC TTT TGG GGG AGT GTG GCT TAT AAA AAC ATC GTG GGT TCG CCA 720 
Ser Arg Phe Trp Gly Ser Val Ala Tyr Lys Asn lie Val Gly Ser Pro 
225 230 235 240 

TGG TTT GTT TAT TTC AGT TTG AGT TTA AAA AAT AGC CTA GAA ATG GAT 768 
Trp Phe Val Tyr Phe Ser Leu Ser Leu Lys Asn Ser Leu Glu Met Asp 
245 250 255 

GCA GAA AAT AAC CCT AAA AAA CGC TAT CTG GTG CGT TGG GAA CGC ATG 816 
Ala Glu Asn Asn Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu Arg Met 
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260 265 270 

TTT AAA AGC GTT GGA GGC TTA GAA AAA ATC ATT AAA AAA GAA AAC GCA 864 
Phe Lys Ser Val Gly Gly Leu Glu Lys He He Lys Lys Glu Asn Ala 
275 280 285 

ACG CAT TAA H77 
Thr His * 873 
290 



(2) ANGABEN ZU SEQ ID NO : 2: 

(i) S EQUENZ KENNZ E I CHEN ; 

(A) LANGE: 291 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2 




let Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
1 5 10 15 

Thr He Val He Val Leu Leu Val He Phe Phe He Ala Gin Ala Phe 
20 25 30 

He He Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 40 45 

Leu Phe Val Lys Lys Phe Ser Tyr Gly He Pro He Pro Lys He Pro 
50 55 60 

Trp He Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

He Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe He Pro 
85 90 95 

Pro His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala He Gly 
100 105 110 

Gly Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
* 115 120 125 

Glu Ser Asp Thr Asp Lys Asn Tyr He Ala Lys His Tyr Pro Asn Ala 
130 135 140 

Met Thr Lys Glu Phe Met Gly Lys He Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

Asn Glu His Pro Gly He His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

Leu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn He Ser Met 
180 185 190 

Gin Leu He Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys He Asn 
195 200 205 

Asp Asp Glu Phe Phe Met He Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 
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Ser Arg Phe Trp 
225 

Trp Phe Val Tyr 



Ala Glu Asn Asn 
260 

Phe Lys Ser Val 
275 

Thr His * 
290 



Gly Ser Val Ala 
230 

Phe Ser Leu Ser 
245 



Pro Lys Lys Arg 



Gly Gly Leu Glu 
280 



Tyr Lys Asn He 
235 

Leu Lys Asn Ser 
250 

Tyr Leu Val Arg 
265 

Lys He He Lys 



Val Gly Ser Pro 
240 

Leu Glu Met Asp 
255 

Trp Glu Arg Met 
270 

Lys Glu Asn Ala 
285 



(2) ANGABEN ZU SEQ ID NO : 3: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 67 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPC003 

<ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..267 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

ATG GAA TCA CAA CTC ATG AAA CTC GCC ATT GAG ACT TAT AAA ATC ACT 4 8 

Met Glu Ser Gin Leu Met Lys Leu Ala He Glu Thr Tyr Lys He Thr 
295 300 305 

TTG ATG ATT TCT TTA CCG GTA TTA TTA GCG GGC TTA GTG GTG GGG CTA 96 
Leu Met He Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val Gly Leu 
310 315 320 

GTC AGT ATT TTT CAA GCG ACC ACT CAA ATC AAT GAA ATG ACC TTG 144 
>eu Val Ser He Phe Gin Ala Thr Thr Gin He Asn Glu Met Thr Leu 
325 330 335 

TCT TTT GTG CCT AAG ATT TTA GCC GTG ATT GGG GTG CTG ATT TTA ACC 192 

f?f Phe Val Pro Lys Ile Leu Ala Val Ile Gly v al Leu He Leu Thr 
340 345 350 355 

ATG CCG TGG ATG ACT AAC ATG CTT TTA GAT TAC ACC AAA ACC TTA ATC 24 0 

Met Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu He 
360 365 370 

AAG CTC ATT CCT AAA ATC ATA GGC TAG 2 67 

Lys Leu Ile Pro Lys Ile Ile Gly * 
375 380 



(2) ANGABEN ZU SEQ ID NO : 4: 




( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 89 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 4: 

Met Glu Ser Gin Leu Met Lys Leu Ala lie Glu Thr Tyr Lys lie Thr 
1 5 10 15 

Leu Met He Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val Gly Leu 
20 25 30 

Leu Val Ser He Phe Gin Ala Thr Thr Gin He Asn Glu Met Thr Leu 
35 40 45 

Ser Phe Val Pro Lys He Leu Ala Val He Gly Val Leu He Leu Thr 
50 55 60 

Met Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu He 
I 65 70 



75 80 



Lys Leu He Pro Lys He He Gly * 
85 

(2) ANGABEN ZU SEQ ID NO: 5: 

( i ) SEQUENZ KENNZ EI CHEN : 

(A) LANGE: 714 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPC005 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..714 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 5: 

ATG CCT ATT AAC CCT CTC TAT CTT TTC CCT AAT CTT TTT ACC GCT AGC 4 8 

S~ Ile Asn Pro Leu Leu phe Pr o Asn Leu Phe Thr Ala Ser 

90 95 100 105 

AGT ATT TTT TTA GGC ATG ATG AGT ATT TTT TAC GCT TCC AGT TAC CAA 96 
Ser He Phe Leu Gly Met Met Ser Ile Phe Tyr Ala Ser Ser Tyr Gin 
HO 115 12 o 

TTT GTC ATG GCG TGT TGG TTA GTG GTA GCG AGC CTT ATT TTA GAC GGG 144 
Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu Ile Leu Asp Gly 
12 5 130 135 

CTT GAT GGG CGT GTC GCA AGG CTT ACC AAC ACC ACC AGC AAG TTT GGT 192 
Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
140 145 150 
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ATA GAA TTT GAC TCA CTG GCT GAT GTA ATC GCT TTT GGG GTA GCC CCA 240 
He Glu Phe Asp Ser Leu Ala Asp Val He Ala Phe Gly Val Ala Pro 
155 160 165 

AGC TTA ATC ACT TAC TTT TAT GTG GGG TAT AAC TTT GGG CGC ATA GGC 2 88 

Ser Leu He Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg He Gly 
170 175 180 185 

ATG GCG GTG AGC GCG TTG TTT GTG ATT TTT GGA GCG ATA CGA TTG GCA 33 6 

Met Ala Val Ser Ala Leu Phe Val He Phe Gly Ala He Arg Leu Ala 
190 195 200 

CGA TTC AAT ATC AGC ACC AAC ACA AGC GAC CCC TAT TCT TTT ATC GGT 3 84 

Arg Phe Asn He Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe He Gly 
205 210 215 

ATC CCC ATT CCT GCG GCG GCG GTA TTG GTG GTG CTT TGT GTG TTA TTG 432 
He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
220 225 230 

GAT AAC AAA TAC CAT TTT TTA GAA GGA AAT ACC GAA AAG TTA TTT TTA 4 80 

sp Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
235 240 245 

AGC TTT ATT GTT TTA TTG GGG GTG CTT ATG GTG AGC AAT ATC CGC TAC 528 
Ser Phe He Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
250 255 260 265 

CCT AAT TTT AAA AAA GTC AAA TGG AAT CTC AAG CTT TTT ATC TTA GTG 576 
Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe He Leu Val 
270 275 280 

TTG ATT TTT TTA TCG TTA GTG TTT GTG CGC CCT TTA GAG GCT TTA AGC 624 
Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
285 290 295 

GTG TTT ATG GGG TTG TAT TTG ATT TAT GGC ATC ATT CGG TGG CTT TTT 672 
Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
300 305 310 

TTA ATG GTA AAA ATT ATT TTT AAT AAA AAT AAA AGT GCA TGA 714 
Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
315 320 325 

2) ANGABEN ZU SEQ ID NO : 6: 

( i ) SEQUENZKENNZE ICHEN : 

(A) LANGE: 238 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

Met Pro He Asn Pro Leu Tyr Leu Phe Pro Asn Leu Phe Thr Ala Ser 
1 5 10 15 

Ser He Phe Leu Gly Met Met Ser He Phe Tyr Ala Ser Ser Tyr Gin 
20 25 30 



Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu He Leu Asp Gly 
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35 40 45 

Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
50 55 60 

lie Glu Phe Asp Ser Leu Ala Asp Val He Ala Phe Gly Val Ala Pro 
65 70 75 80 

Ser Leu He Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg lie Gly 
85 90 95 

Met Ala Val Ser Ala Leu Phe Val He Phe Gly Ala He Arg Leu Ala 
100 105 110 

Arg Phe Asn He Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe He Gly 
115 120 125 

He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
130 135 140 

Asp Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
45 150 155 160 

Ser Phe He Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
165 170 175 

Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe He Leu Val 
180 185 190 

Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
195 200 205 

Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
210 215 220 

Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
225 230 235 

(2) ANGABEN ZU SEQ ID NO: 7: 

( i ) S EQUENZ KENNZE ICHEN : 

(A) LANGE: 552 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 
<D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 

(B) CLON(E) : HPC029 (HPC030) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .552 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 7: 

ATG GCA GAA GAA CAA GAA AAT ACC GCG CAA CAA CCC CAA AAA AAA AGC 4 8 

Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
240 245 250 
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AAA GCC CTT TTA TTT GTC ATT ATT GGA AGC GTG TTA GTG ATG CTT TTG 96 
Lys Ala Leu Leu Phe Val lie lie Gly Ser Val Leu Val Met Leu Leu 
255 260 265 270 

TTG GTG GGG GTG ATT ATC ATG CTG CTT ATG GGG AAT AAG GAA GAA TCC 144 
Leu Val Gly Val lie lie Met Leu Leu Met Gly Asn Lys Glu Glu Ser 
275 280 285 

AAA GAA AAC GCT TCT AAA AAC ACC CAA GAA GTC CAA GCT AAT CCT ATG 192 
Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
290 295 300 

GCG AAC AAA AAT CAA GAA GCC AAA GAA GGC TCT AAT ATC CAG CAA TAT 240 
Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn He Gin Gin Tyr 
305 310 315 

CTG GTG CTT GGG CCT TTG TAT GCG ATT GAT GCG CCT TTT GCG GTG AAT 288 

U Gly Pro Leu ^ Ala Ile As P Ala Pro Phe Ala Val Asn 
320 325 330 

TTG GTT TCT CAA AAT GGC AGA CGC TAC CTT AAG GCT TCC ATT TCG TTA 336 
■eu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser Ile Ser Leu 
35 340 345 3S0 

GAA TTG AGC AAT GAA AAG CTT TTA AAT GAA GTC AAG GTT AAA GAC ACA 3 84 

fc>J.u Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
355 360 365 

GCG ATT AAG GAC ACG ATT ATA GAG ATT CTA TCG TCT AAA AGC GTG GAA 432 
Ala Ile Lys Asp Thr Ile Ile Glu Ile Leu Ser Ser Lys Ser Val Glu 
37 ° 375 380 

vl? A S T AAA GGT AAA AAC AAG CTT AAA GAT GAA ATT AAG 480 

GJ-u val Val Thr Asn Lys Gly Lys Asn Lys Leu Lys Asp Glu Ile Lys 
385 390 395 

AGC CAT TTG AAT TCG TTT TTG ATT GAT GGC TTT ATT AAA AAT GTC TTT 52 8 

?i« SU Asn Ser Phe Leu Ile Asp Gly Phe Ile Lys Asn Val Phe 
400 405 410 

TTC ACT GAT TTC ATT ATT CAA TAA 
Phe Thr Asp Phe Ile Ile Gin * 
415 420 



2) ANGABEN ZU SEQ ID NO: 8: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 184 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 8: 

Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
15 10 15 

Lys Ala Leu Leu Phe Val Ile Ile Gly Ser Val Leu Val Met Leu Leu 
20 25 30 

Leu Val Gly Val Ile Ile Met Leu Leu Met Gly Asn Lys Glu Glu Ser 
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35 40 45 

Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
50 55 60 

Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn He Gin Gin Tyr 
65 7 ° 75 80 

Leu Val Leu Gly Pro Leu Tyr Ala He Asp Ala Pro Phe Ala Val Asn 
85 90 95 

Leu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser He Ser Leu 
100 105 110 

Glu Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
115 120 125 

Ala lie Lys Asp Thr He He Glu He Leu Ser Ser Lys Ser Val Glu 
130 135 140 

Glu Val Val Thr Asn Lys Gly Lys Asn Lys Leu Lys Asp Glu He Lys 
^ 150 155 160 

Ser His Leu Asn Ser Phe Leu lie Asp Gly Phe He Lys Asn Val Phe 
16 5 170 17 5 

Phe Thr Asp Phe He He Gin * 
180 



(2) ANGABEN ZU SEQ ID NO : 9: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 858 Basenpaare 
<B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS042 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..858 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 9: 

Se? J5S ri?, IT 1 ^ G CTA ATC ATC CTC ATT GTG GTG GTA GGC GTG 

Met Lys Glu Phe Lys He Leu He He Leu He Val Val Val Gly Val 

185 190 195 * 200 

ne s t t ^ g gct tat gcg tcg ° tg atg cac ^ 

lie Tyr Tyr Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
205 210 215 

GTC GCT CCG GCA GAT TTT GCT TTC AAG GAT TTA GAG CCG ATG GAT TTA 144 
Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
220 225 230 

AAA AAT GGC GAT GCT AAT AAG GGC AAA CAG CTT GTA GCT GAA AAT TGC 



48 



96 



192 
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Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
235 240 245 

ACC GCT TGC CAT GGC ATT AAA TCC CAA AAC ATT CCA GCC CCT ATG GAC 240 
Ala Cys His Gly He Lys Ser Gin Asn He Pro Ala Pro Met Asp 
250 255 260 

AGC CTT AGC GCG AGC AAC TCT TTT GGG GTC GTG CCA CCG GAT TTA AGC 288 
Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 
265 2 70 275 280 

CAT GTG GCG GGG GTT TTG AAC GCG AAT TTC TTA GCC CAC TTC ATC AAA 336 
His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe He Lys 
2 85 290 295 

GAC CCT GTA AAA ACG GCG AAA TTG AGC CAT AAG TTC AAC GAT GAA AGG 3 84 

Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arq 
300 305 310 

CCC TAT CCT ATG CCG GCG TTT TCT CAA TTT AGC GAT AAA GAC TTG AGC 432 
Pro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
L 315 320 325 

GAT ATT GTG GCG TAT CTC ACT TCT ATT TTG CCT AAA AAT TTG AGC GAT 4 80 

Asp lie Val Ala Tyr Leu Thr Ser He Leu Pro Lys Asn Leu Ser Asp 
330 335 340 

AAG GAA GTG TTC GCG CAA AGC TGT CAA AGG TGC CAT AGC TTG GAT TAT 528 
Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
345 350 355 360 

GCG AAA GAT AAG GCC TTT AGC GAT CCT AAA GAT CTA GCC AAT TAT TTA 576 
Ala Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
365 370 375 

GGC TCT CAT GCA CCT GAT TTG TCC ATG ATG ATT AGA GCT AAA GGC GAA 624 
fc.ly Ser His Ala Pro Asp Leu Ser Met Met He Arg Ala Lys Gly Glu 
380 385 390 

CAT GGT TTG AAT ATT TTC ATC AAC GAT CCG CAA AAG CTT TTG CCT GGC 672 
His Gly Leu Asn He Phe He Asn Asp Pro Gin Lys Leu Leu Pro Gly 
395 400 405 

CG GCT ATG CCC AGA GTG GGA TTG AGT GAA CAA GCT CAA AAA CAA GTC 72 0 

Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
410 415 420 

tT° I AT TTG ^ AAA GCA GGC GAT AGG AAA AAA CAT GAA AGG AAT 768 

He Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
425 43 <> 435 440 

ACC TTA GGG ATA AAA ATC ATG ATT TTC TTT GCG GTG CTG TCG TTC TTG . 816 
Thr Leu Gly He Lys He Met He Phe Phe Ala Val Leu Ser Phe Leu 
' 445 450 455 

GCT TAT GCG TGG AAA AGA AAA GTT TGG AGC GAA GTG CAT TGA 85 8 

Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
460 465 470 



(2) ANGABEN ZU SEQ ID NO: 10: 




11 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 2 86 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Lys Glu Phe Lys lie Leu He He Leu He Val Val Val Gly Val 
1 5 10 15 

He Tyr Tyr Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
20 25 30 

Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
35 40 45 

Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
50 55 60 

Thr Ala Cys His Gly He Lys Ser Gin Asn He Pro Ala Pro Met Asp 
* 65 70 75 80 

Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 
85 90 95 

His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe He Lys 
100 105 110 

Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arg 
H5 120 125 

Pro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
130 135 140 

Asp He Val Ala Tyr Leu Thr Ser He Leu Pro Lys Asn Leu Ser Asp 
145 150 155 160 

Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
165 170 175 

Ala Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
180 185 190 

ly Ser His Ala Pro Asp Leu Ser Met Met He Arg Ala Lys Gly Glu 
195 200 205 

His Gly Leu Asn He Phe He Asn Asp Pro Gin Lys Leu Leu Pro Gly 
210 215 220 

Thr Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
225 230 235 240 

He Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
245 250 255 

Thr Leu Gly He Lys He Met He Phe Phe Ala Val Leu Ser Phe Leu 
260 265 270 

Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
275 280 285 
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(2) ANGABEN ZU SEQ ID NO: 11: 

( i ) S EQUENZ KEWNZE I CHEN : 

(A) LANGE: 192 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 

(B) CLON(E) : HPC057 (HPC109, HPC138) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) IiAGE : 1 . .192 



» 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 11: 

,TG AAT ACA GAA ATT TTA ACC ATC ATG TTA GTT GTC TCA GTG CTT ATG 
tet Asn Thr Glu He Leu Thr He Met Leu Val Val Ser Val Leu Met 
290 295 300 



GGA TTG GTA GGC TTA ATA GCG TTT TTG TGG GGG GTT AAA AGC GGT CAG 
Gly Leu Val Gly Leu He Ala Phe Leu Trp Gly Val Lys Ser Gly Gin 
305 310 315 

TTT GAC GAT GAA AAA CGC ATG CTT GAA AGC GTG TTG TAT GAC AGC GTG 
Phe Asp Asp Glu Lys Arg Met Leu Glu Ser Val Leu Tyr Asp Ser Val 
320 325 330 

AGC GAT TTG AAC GAA GCG ATT TTA CAA GAA AAA CGC CAA AAG AAT TAA 
Ser Asp Leu Asn Glu Ala He Leu Gin Glu Lys Arg Gin Lys Asn * 
335 340 345 350 



(2) ANGABEN ZU SEQ ID NO: 12: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 64 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Glu He Leu Thr He Met Leu Val Val Ser Val Leu Met 
5 10 15 

Gly Leu He Ala Phe Leu Trp Gly Val Lys Ser Gly Gin 
20 25 30 

Glu Lys Arg Met Leu Glu Ser Val Leu Tyr Asp Ser Val 
40 45 

Asn Glu Ala He Leu Gin Glu Lys Arg Gin Lys Asn * 
55 60 



Met Asn Thr 
1 

Gly Leu Val 



Phe Asp Asp 
35 

Ser Asp Leu 
50 



(2) ANGABEN ZU SEQ ID NO: 13: 
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( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS062 (HPS171) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) IiAGE : 1 . .957 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 

ATG CCC GAT TCT GCG AAC ATG ATC ATT TTA TTT TTC ACC TAT GAT ATT 4 8 

Met Pro Asp Ser Ala Asn Met lie He Leu Phe Phe Thr Tyr Asp He 
65 70 75 80 

:TA TTC GCT CTC AAT TAC ACC TTG CCC ATT TCC TTG CTT TTG GCG ATG 96 
Leu Phe Ala Leu Asn Tyr Thr Leu Pro He Ser Leu Leu Leu Ala Met 
85 90 95 

GTT TTA TTT TAT ATC GCA TTC ATT AAA TCC AAC CAA TAC ACC GCC CTG 144 
Val Leu Phe Tyr He Ala Phe He Lys Ser Asn Gin Tyr Thr Ala Leu 
1Q 0 105 110 

CTC TCC ATT GGC TTT TCC AAA TGC CAG ATT TTA AGC CCT ATT TTT TTG 192 
Leu Ser He Gly Phe Ser Lys Cys Gin He Leu Ser Pro He Phe Leu 
115 120 125 

ATT AGT CTG TTT TTC ACG GCT ATT TAT GTG GGG TTG AAC GCG ACT CCT 24 0 

He Ser Leu Phe Phe Thr Ala He Tyr Val Gly Leu Asn Ala Thr Pro 
130 135 140 

TTT GTG TAT ATG GAA GAA AAA ACG CAA AAT TTA ATC TAT AAA GAC AAT 288 
Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu He Tyr Lys Asp Asn 
145 150 155 160 



432 



TCT TTG AGC GTC TCA GAG CAT TTG TTA GTG AAA TAT AAC GAT GAT TAC 336 
er Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
165 170 175 

GTG TAT TTT GAT AAG ATT AAT CCC CTA TTG CAA AAA GCC CAA AAC ATC 3 84 

vai Tyr Phe Asp Lys lie Asn Pro Leu Leu Gin Lys Ala Gin Asn lie 

185 190 

AAG GTT TTT CGC CTA AAA GAT AAG ACT TTA GAA TCT TAC GCT GAA GCT 
Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
195 200 205 

AAA GAA GCT TTT TTT GAA GAC AAG TAT TGG ATT TTG CAT GAC ACT ACT 4 80 

yS 3 Phe Phe Glu As P Tr P Ile Leu His Asp Thr Thr 

210 215 220 

Axe TAT GAG ATG CCC TTG AGT TTT GAA CTG GGT GCA AAC GCT TTA AGC 52 8 

lie Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
225 230 235 240 
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?S r TA A S C TTT *** ACG CTC M AAT TTC CGC CCT AAA 576 

Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
245 250 255 

GTT TTA GAC ACC ATT TAT CAA AAC AAG CCC GCG GTT TCT ATC ACA GAC 624 
Val Leu Asp Thr He Tyr Gin Asn Lys Pro Ala Val Ser He Thr Asp 
260 265 270 

GCT CTT TTA TCT TTG CAT GCT TTA GTG CGC CAA AAC GCA GAC ACG AAA 672 
Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
275 280 285 

AAA GTG CGA TCG TTT TTG TAT GTG TTT GCG ATT TTG CCC TTT TTT GTG 72 0 

Lys Val Arg Ser Phe Leu Tyr Val Phe Ala He Leu Pro Phe Phe Val 
290 295 300 



CCG TTT TTA AGC GTT TTA ATC GCT TAT TTT TCG CCC AGT CTC GCC CGC 768 
Pro Phe Leu Ser Val Leu He Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
305 310 315 320 

TAT GAA AAC CTG GCT CTT TTA GGG CTA AAG TTT ATC ATT ATC ACG CTC 816 
Tyr Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe He He He Thr Leu 
325 330 335 

GTT GTT TGG GGG CTA TTC TTT GCT TTA GGG AAG TTC AGC ATT TCA GGG 864 
Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser He Ser Gly 
340 345 350 

ATA CTC ATT CCT GAA ATA GGC GTG CTA TCG CCC TTT TTT ATA TTC TTA 912 
He Leu He Pro Glu He Gly Val Leu Ser Pro Phe Phe He Phe Leu 
355 360 365 

GCT CTT AGT CTT TGG TAT TTT AAA AAG CTT AAT AAG AGG TTG TAG 957 
Ala Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu * 
370 375 380 



(2) ANGABEN ZU SEQ ID NO: 14: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

He Leu Phe Phe Thr Tyr Asp He 
10 15 

Pro He Ser Leu Leu Leu Ala Met 
25 30 

Lys Ser Asn Gin Tyr Thr Ala Leu 
45 

Gin He Leu Ser Pro He Phe Leu 
60 

Tyr Val Gly Leu Asn Ala Thr Pro 
75 80 



Met Pro Asp Ser 
1 

Leu Phe Ala Leu 
20 

Val Leu Phe Tyr 
35 

Leu Ser He Gly 
50 

He Ser Leu Phe 



Ala Asn Met He 
5 

Asn Tyr Thr Leu 

He Ala Phe He 
40 

Phe Ser Lys Cys 
55 

Phe Thr Ala He 
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Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu He Tyr Lys Asp Asn 
85 90 95 

Ser Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
100 105 110 

Val Tyr Phe Asp Lys He Asn Pro Leu Leu Gin Lys Ala Gin Asn He 
115 120 125 

Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
130 135 140 

Lys Glu Ala Phe Phe Glu Asp Lys Tyr Trp He Leu His Asp Thr Thr 
145 150 155 160 

He Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
165 170 175 

Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
180 185 190 

al Leu Asp Thr He Tyr Gin Asn Lys Pro Ala Val Ser He Thr Asp 
195 200 205 

Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
21° 215 220 

Lys Val Arg Ser Phe Leu Tyr Val Phe Ala He Leu Pro Phe Phe Val 
225 230 235 240 

Pro Phe Leu Ser Val Leu He Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
245 250 255 

Tyr Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe He He He Thr Leu 
260 265 270 

Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser He Ser Gly 
275 280 285 

He Leu He Pro Glu He Gly Val Leu Ser Pro Phe Phe He Phe Leu 
290 295 300 

Ala Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu * 
1205 310 315 

2) ANGABEN ZU SEQ ID NO: 15: 

{ i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1629 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPS065 (HPS153) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .1629 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 



ATG AAT AAA CCA TTT TTA ATC TTA CTC ATA GCC CTA ATT GTC TTT AGC 
Met Asn Lys Pro Phe Leu He Leu Leu He Ala Leu He Val Phe Ser 
320 325 330 335 

GGC TGT AAC ATG AGA AAA TAT TTC AAA CCC GCT AAA CAC CAA ATT AAA 
Gly Cys Asn Met Arg Lys Tyr Phe Lys Pro Ala Lys His Gin He Lys 
340 345 350 

GGC GAA GCG TAT TTC CCT AAC CAT TTG CAA GAA AGT ATC GTT TCG TCT 
Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser He Val Ser Ser 
355 360 365 

AAT CGT TAT GGA GCC ATT TTG AAA AAT GGA GCG GTT ATA GGC GAT AAA 
Asn Arg Tyr Gly Ala He Leu Lys Asn Gly Ala Val He Gly Asp Lys 
370 375 380 



GGT TTA ACG CAG CTA AGA ATC GGT AAG AAC TTC AAT TAC GAA AGC AGT 
Gly Leu Thr Gin Leu Arg He Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
385 390 395 




TT TTA AAT GAG AGT CAA GGG TTT TTT ATT CTT GCG CAA GAT TGT TTG 
Phe Leu Asn Glu Ser Gin Gly Phe Phe He Leu Ala Gin Asp Cys Leu 
400 405 410 415 

AAC AAG ATT GAT AAA AAA ACA AAC AAA AGC AAG GTG GCT AAG ACT GAA 
Asn Lys He Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
420 425 430 

GAA ACG GAA TTG AAA TTA AAG GGC GTT GAA GCG GAA GTC CAA GAT AAA 
Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
435 440 445 

GTC TGT CAT CAA GTG GAA TTG ATT AGC AAT AAC CCT AAC GCC AGC CAA 
Val Cys His Gin Val Glu Leu He Ser Asn Asn Pro Asn Ala Ser Gin 
450 455 460 

CAA TCT ATC GTT ATT CCT TTG GAG ACT TTT GCC TTG AGC GCA AGC GTT 
Gin Ser He Val He Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
465 470 475 

AAA GGG AAT CTT TTA GCG GTG GTG TTA GCG GAC AAT TCA GCG AAC TTA 
ys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 
80 485 490 495 

TAC GAC ATC ACT TCT CAA AAA TTG CTT TTT AGT GAG AAA GGT TCC CCA 
Tyr Asp He Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
500 505 510 

AGC ACC ACG ATC AAT TCT TTA ATG GCG ATG CCT ATT TTT ATG GAT ACG 
Ser Thr Thr He Asn Ser Leu Met Ala Met Pro He Phe Met Asp Thr 
515 520 525 

GTC GTG GTG TTC CCC ATG CTA GAT GGG CGC TTG TTG GTC GTG GAT TAT 
Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
530 535 540 

GTG CAC GGA AAC CCT ACG CCT ATT AGA AAC ATT GTT ATC AGC AGC GAT 
Val His Gly Asn Pro Thr Pro He Arg Asn He Val He Ser Ser Asp 
545 550 555 



17 



AAG TTT TTT AAC AAT ATC ACC TAC CTT ATC GTA GAT GGC AAT AAC ATG 76 8 

Lys Phe Phe Asn Asn He Thr Tyr Leu He Val Asp Gly Asn Asn Met 
560 565 570 575 

ATC GCT TCT ACA GGG AAA AGG ATA CTC TCA GTA GTG AGC GGT CAA GAG 816 
He Ala Ser Thr Gly Lys Arg He Leu Ser Val Val Ser Gly Gin Glu 
580 585 590 

TTC AAC TAT GAT GGG GAT ATT GTG GAT TTG CTT TAT GAT AAG GGG ACT 8 64 

Phe Asn Tyr Asp Gly Asp He Val Asp Leu Leu Tyr Asp Lys Gly Thr 
595 600 605 

TTA TAT GTG CTC ACG CTA GAC GGG CAG ATT TTG CAA ATG GAT AAG AGT 912 
Leu Tyr Val Leu Thr Leu Asp Gly Gin He Leu Gin Met Asp Lys Ser 
610 615 620 

TTG AGG GAA TTA AAC AGC GTG AAA CTG CCT TCG TCG CTC AAC ACG ATT 960 
Leu Arg Glu Leu Asn Ser Val Lys Leu Pro Ser Ser Leu Asn Thr He 
625 630 635 

GTA TTA AAC CAT AAT AAA TTG TAT TCT TTA GAA AAA CGA GGG TAT GTG 1008 
T al Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
40 645 650 655 

ATA GAG GTG GAT TTA AAT GAT TTT GAT TCG TAT AAT GTC TAT AAA ACG 1056 
He Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
660 665 670 

CCA ACT ATA GGC AGT TTT AAG TTT TTT TCA TCT AAT CGT TTG GAT AAA 1104 
Pro Thr He Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
675 680 685 

GGG GTG TTT TAT GAT AAA AAT CGG GTG TAT TAC GAT CGC TAC TAT TTA 1152 
Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
690 695 700 

GAT TAT AAC GAT TTT AAA CCA AAA CTT TAT CCC GTT GTG GAA AAA TCG 12 0 0 

Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
705 710 715 

GCA TCT AAA AAA TCT CAA AAA GGC GAA AAA GGG AAC GCT CCT ATT TAT 1248 
Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro He Tyr 
720 725 730 735 

TG CAA GAA AGG CAT AAA GCT AAA GAA AAT AAA CAG CCT TTA GAA GAA 1296 
eu Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
740 745 750 

AAC AAA GTT AAA CCA AGA AAT AGC GGG TTT GAA GAA GAA GAG GTT AAA 1344 
Asn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
755 760 765 

ACC AGA AGG CCT GAG CCT ATT AGG GAT CAA AAT AAC GCC ACC CAA CAA 13 92 

Thr Arg Arg Pro Glu Pro He Arg Asp Gin Asn Asn Ala Thr Gin Gin 
770 775 780 

GGC GAA ACA AAA AAC AAT GAA AGT AAA AAC GCT CCT GTC TTA AAA GAA 1440 
Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
785 790 795 

AAC GCC GCT AAA AAA GAA GTG CCA AAA CCA AAT TCT AAA GAA GAA AAA 1488 
Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
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800 805 810 815 

CGC CGC TTG AAA GAA GAA AAG AAA AAA GCC AAA GCC GAA CAA AGA GCG 1536 
Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala 
820 825 830 

AGA GAA TTT GAA CAA AGA GCG AGA GAG CAT CAA GAA AGA GAT GAA AAA 1584 
Arg Glu Phe Glu Gin Arg Ala Arg Glu His Gin Glu Arg Asp Glu Lys 
835 840 845 

GAG CTT GAA GAA AGA AGA AAA GCT TTA GAA ATG AAT AAG AAG TAG 162 9 

Glu Leu Glu Glu Arg Arg Lys Ala Leu Glu Met Asn Lys Lys * 
850 855 860 



(2) ANGABEN ZU SEQ ID NO: 16: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE : 543 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 

Met Asn Lys Pro Phe Leu He Leu Leu He Ala Leu He Val Phe Ser 
1 5 10 15 

Gly Cys Asn Met Arg Lys Tyr Phe Lys Pro Ala Lys His Gin He Lys 
20 25 30 

Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser He Val Ser Ser 
35 40 45 

Asn Arg Tyr Gly Ala He Leu Lys Asn Gly Ala Val He Gly Asp Lys 
50 55 60 

Gly Leu Thr Gin Leu Arg He Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
65 70 75 80 

Phe Leu Asn Glu Ser Gin Gly Phe Phe He Leu Ala Gin Asp Cys Leu 

85 90 95 

.sn Lys He Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
1 100 105 110 

Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
115 120 125 

Val Cys His Gin Val Glu Leu He Ser Asn Asn Pro Asn Ala Ser Gin 
130 135 140 

Gin Ser He Val He Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
145 150 155 160 

Lys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 
165 170 175 

Tyr Asp He Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
180 185 190 

Ser Thr Thr He Asn Ser Leu Met Ala Met Pro He Phe Met Asp Thr 
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195 200 205 

Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
210 215 220 

Val His Gly Asn Pro Thr Pro lie Arg Asn lie Val lie Ser Ser Asp 
225 230 235 240 

Lys Phe Phe Asn Asn lie Thr Tyr Leu lie Val Asp Gly Asn Asn Met 
245 250 255 

lie Ala Ser Thr Gly Lys Arg lie Leu Ser Val Val Ser Gly Gin Glu 
260 265 270 

Phe Asn Tyr Asp Gly Asp lie Val Asp Leu Leu Tyr Asp Lys Gly Thr 
275 280 285 

Leu Tyr Val Leu Thr Leu Asp Gly Gin lie Leu Gin Met Asp Lys Ser 
290 295 300 

eu Arg Glu Leu Asn Ser Val Lys Leu Pro Ser Ser Leu Asn Thr lie 
05 310 315 320 

Val Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
325 330 335 

lie Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
340 345 350 

Pro Thr lie Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
355 360 365 

Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
370 375 380 

Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
385 390 395 400 

Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro lie Tyr 
405 410 415 

Leu Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
420 425 430 

sn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
435 440 445 

Thr Arg Arg Pro Glu Pro lie Arg Asp Gin Asn Asn Ala Thr Gin Gin 
450 455 460 

Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
465 470 475 480 

Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
485 490 495 

Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala 
500 505 510 

Arg Glu Phe Glu Gin Arg Ala Arg Glu His Gin Glu Arg Asp Glu Lys 
515 520 525 



4 
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Glu Leu Glu Glu Arg Arg Lys Ala Leu Glu Met Asn Lys Lys 
530 535 540 Y 

(2) ANGABEN ZU SEQ ID NO: 17: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 13 77 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 




(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS066 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1377 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 



£1? t C IT ^ SS T ? CT AGC 3 T T 1 TTA ™ TCG TTT CGC TTG AAG CGT 



Met Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu £?s £J 

T? A 2?° ll T T A TTG ATT TCT "A GCG TTA TTA ATC ACG CCC TTT 
Tyr lie Gly Phe Leu Leu He Ser Leu Ala Leu Leu He Thr Pro Phe 
bU 565 570 575 

Sal Sf tTI ? AT ^ GC ° ^ TTG TTT TTG ATC TCT TTT GAG CAT AAG 
Val Arg He Asp Gly Ala His Leu Phe Leu He Ser Phe Glu His Lys 

580 585 590 

CAA CTG CAT TTT TTA GGC AAG ATC TTT AGC GCT GAA GAA TTG CAA GTC 
Gin Leu His Phe Leu Gly Lys He Phe Ser Ala Glu Glu Leu Gin" ?S 
595 600 605 

mI G o CT ^ TT ATG GTT ATT ™ CTT TTT ATA GGG ATT TTT TTC ATC ACC 
Met Pro Phe Met Val He Leu Leu Phe He Gly He Phe Phe He Thr 
610 615 620 

; CT AGC CTT GGG CGT GTG TGG TGC GGT TGG GCT TGC CCG CAA ACC TTT 
,hr Ser Leu Gly Arg Val Trp Cys Gly Trp Ala Cys Pro Gin ?Sr S£ 

b " 630 635 

TTA AGG GTG CTT TAT AGA GAT GTG ATT GAA ACC AAG ATT TTC AAA CTC 
Leu Arg Val Leu Tyr Arg Asp Val He Glu Thr Lys lie pJe iJJ LeS 

645 650 655 



48 



96 



144 



192 



240 



288 



336 



SI JJ1 f!S tT C c GC ^ C CAA GAA AGC CCT m ^ C A ^C CCA AGC 384 

Hxs Lys Lys He Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 

660 665 670 

TAC AAG ATC CGT AAA GTA TTG AGC GTT TTA TTG TTC GCT CCT GTT PTP a« 
Tyr Lys He Arg Lys Val Leu Ser Val Leu Leu III III Irl Sal Si 
675 680 685 

SfS 2?S ^ TG TTG TTT TTC TTT TAT ™ ATC GCC CCA GAA GAT 480 

Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe He Ala Pro Glu Asp 

byo 695 700 
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TTT TTT ATG TAT CTT AAA AAC CCT AGC GAT CAC CCT ATT GCT ATG GGT 52 8 

Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro lie Ala Met Gly 
705 710 715 

TTT TGG CTT TTT AGC ACG GCT GTG GTG CTA TTT GAT ATA GTG GTG GTT 576 
Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp lie Val Val Val 
720 725 730 735 

GCG GAG CGT TTT TGC ATT TAT TTA TGC CCT TAC GCT AGG GTG CAA TCG 624 
Ala Glu Arg Phe Cys lie Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 
740 745 750 

GTG TTG TAT GAC AAT GAC ACC TTA AAC CCT ATT TAT GAT GAA AAG CGC 672 
Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro lie Tyr Asp Glu Lys Arg 
755 760 765 

GGC GGA GCG CTT TAT AAT AAT CAG GGC CAT CTC TTC CCC TTA CCT CCC 720 
Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
770 775 780 



Wr 



AAA CGC AGC CCA GAA AAC GAA TGC GTG AAT TGT TTG CAT TGC GTG 768 
ys Lys Arg Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
785 790 795 



CAG GTT TGC CCC ACG CAT ATT GAC ATC AGG AAG GGC TTG CAA TTA GAA 816 
Gin Val Cys Pro Thr His lie Asp lie Arg Lys Gly Leu Gin Leu Glu 
8 °0 805 810 815 

TGC ATC AAT TGT TTA GAA TGC GTG GAT GCA TGC ACG ATT ACC ATG GCT 8 64 

Cys lie Asn Cys Leu Glu Cys Val Asp Ala Cys Thr He Thr Met Ala 
820 825 830 

AAA TTT AAC CGC CCT TCA CTC ATC CAA TGG TCT TCA ACT AAC GCT ATT 912 
Lys Phe Asn Arg Pro Ser Leu He Gin Trp Ser Ser Thr Asn Ala He 
835 840 845 

AAT ACG CGC CAA AAA GTG CAC CTG GTG CGT TTA AAA ACG ATC GCT TAC 96 0 

Asn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr He Ala Tyr 
850 855 860 

ATG GGG GTT ATC GCT ATT GTG ATC GCT CTT TTA GCC ATC ACT TCG TTT 10 08 

Met Gly Val He Ala He Val He Ala Leu Leu Ala He Thr Ser Phe 
865 870 875 



AAA GAA CGC ATG CTC TTA GAC ATT AAC CGC AAC AGC GAT CTG TAT 1056 
iys Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
880 885 890 895 

GAA TTG CGC TCT AGC GGG TAT GTG GAT AAC GAT TAC GTG TTT TTA TTC 1104 
Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 
900 905 910 

CAC AAC ACG GAC AAT AAA GAC CAT GAG TTT TAT TTC AAA GTT TTA GGG 1152 
His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
915 920 925 

CAA AAA GAC ATT CAG ATC AAA AAG CCT TTA AAT CCT ATC GCC ATT AAA 12 00 

Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
930 935 940 

GCC GGG CAA AAG ATT AAA GCG GTA GTG ATT TTA AGA AAA CCC CTA AAG 1248 
Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
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945 










950 










955 










AGT 
Ser 
960 


AAC 
Asn 


GCC 
Ala 


ACA 
Thr 


GAA 
Glu 


TAC 
Tvr 
965 


AAG 
Lys 


AAC 
Asn 


GCT 
Ala 


AAA 
Lys 


GAC 

A en 

970 


GCT 

.f"V J. d 


CTA 
Leu 


ATC 
x le 


CCC 
Pro 


ATT 
lie 
975 


ACC 
Thr 


ATA 
He 


CAA 
Gin 


GCT 
Ala 


TAT 
Tyr 
980 


AGC 
Ser 


GCG 
Ala 


GAC 
Asp 


GAT 
Asp 


AAG 
Lys 
985 


AAT 
Asn 


ATT 
He 


ACG 
Thr 


ATA 
He 


GAA 
Glu 
990 


AGG 
Arg 


GAA 
Glu 


TCG 
Ser 


GTG 
Val 


TTT 
Phe 
995 


ATT 
He 


GCA 
Ala 


CCA 
Pro 


AGT 
Ser 


GAG 
Glu 
100G 


GAT 
Asp 

I 


TGA 
* 














(2) ANGABEN ZU SEQ ID NO: 18: 

(i) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 45 9 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) S EQUENZ BE SCHRE I BUNG : SEQ ID NO: 18: 

Met Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu Lys Arg 
1 5 10 15 

Tyr He Gly Phe Leu Leu He Ser Leu Ala Leu Leu He Thr Pro Phe 
20 25 30 

Val Arg He Asp Gly Ala His Leu Phe Leu He Ser Phe Glu His Lys 
35 40 45 

Gin Leu His Phe Leu Gly Lys He Phe Ser Ala Glu Glu Leu Gin Val 
50 55 60 

Met Pro Phe Met Val He Leu Leu Phe He Gly He Phe Phe He Thr 
65 70 75 80 

Thr Ser Leu Gly Arg Val Trp Cys Gly Trp Ala Cys Pro Gin Thr Phe 
85 90 95 

ieu Arg Val Leu Tyr Arg Asp Val He Glu Thr Lys He Phe Lys Leu 
1 100 105 110 

His Lys Lys He Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 
115 120 125 

Tyr Lys He Arg Lys Val Leu Ser Val Leu Leu Phe Ala Pro Val Val 
130 135 140 

Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe He Ala Pro Glu Asp 
145 150 155 160 

Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro He Ala Met Gly 
165 170 175 

Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp He Val Val Val 
180 185 190 

Ala Glu Arg Phe Cys He Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 



1296 



1344 



1377 



23 



195 200 205 

Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro lie Tyr Asp Glu Lys Arg 
210 215 220 

Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
225 230 235 240 

Lys Lys Arg Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
245 250 255 

Gin Val Cys Pro Thr His He Asp He Arg Lys Gly Leu Gin Leu Glu 
260 265 270 

Cys lie Asn Cys Leu Glu Cys Val Asp Ala Cys Thr lie Thr Met Ala 
275 280 285 



Lys Phe Asn Arg Pro Ser Leu He Gin Trp Ser Ser Thr Asn Ala He 
290 295 300 



sn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr He Ala Tyr 
05 310 315 320 



Met Gly Val He Ala He Val He Ala Leu Leu Ala He Thr Ser Phe 
325 330 335 

Lys Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
340 345 350 

Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 
355 360 365 

His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
370 375 380 

Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
385 390 395 400 

Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
405 410 415 

Ser Asn Ala Thr Glu Tyr Lys Asn Ala Lys Asp Ala Leu He Pro He 
420 425 430 

hr He Gin Ala Tyr Ser Ala Asp Asp Lys Asn He Thr He Glu Arg 
435 440 445 

Glu Ser Val Phe He Ala Pro Ser Glu Asp * 
450 455 

(2) ANGABEN ZU SEQ ID NO: 19: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 1533 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS068 
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(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1533 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 

ATG AAA AAA ACA ACC CTC TTT GTA TTG GGC TTA TTA TTT AAT AGC TTT 
Met Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
460 465 470 475 



lie lie Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arq 
640 645 



650 



48 



TTA AAT GCT GTT GAT GGG ATT TCT AAA ACC GAT CTT TCT TCT TTG AAT 96 
Leu Asn Ala Val Asp Gly He Ser Lys Thr Asp Leu Ser Ser SS Jtn 
480 485 490 

TTG GCT GAA GAC AGC GCG CCT TTG AAC CAT CCT AAC GCT CAA AAA CTC 144 
Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
495 500 505 

TCC TTA AAA AAC GCA TGG ACT AGG GTA TTG TCT AAC CAT GAA GGC TTG 192 
" er Leu ^ s Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
510 515 520 

^ TAC GCC ATT AAG CGA GCG AGT AAA ATG AAA TTA GCG 240 
His Ala Gin Glu Tyr Ala He Lys Arg Ala Ser Lys Met Lys Leu Ala 
525 530 535 

GCT AAA CTT TCT TTT TTG CCT CAA ATT GAT TTG AGC GCT TTT TAT GTG 2 88 

Ala Lys Leu Ser Phe Leu Pro Gin He Asp Leu Ser Ala Phe Tyr Val 
1540 545 550 555 

TAT CTC TCT AAC CCC ATT AAA ATG GAT TTT GCC AGC CAA AAA CAA CCG 33 6 

Tyr Leu Ser Asn Pro He Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
560 565 570 

S?S vll *** °? C ACC CAG ATC CAT CAA 000 ATA CAA AAC ATC 384 

Gly Val Gin Lys Ala Thr Asn Gin He His Gin Gly He Gin Asn He 

575 580 585 

Stn t? C S CT TCT GTA ^ ACC CCT CAA ATC CAA GCG GGC 432 

Gin Gin Asn He Pro Ser Gin Val Leu Thr Pro Gin He Gin Ala Gly 
590 595 600 

I? CAA nf 3 JP? « TG CAA 001 TTT 000 GC T TTG AGC AGC ACT TTA GAA 480 
et Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
505 610 615 

GCC CCC TTA TTG TTT TCT AAG CAA AAT GTG GTG ATT GGG GCT TTG AGC 52 8 

Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val He Gly Ala Leu Ser 
620 625 630 635 

tTZ rT« o CC ? TT I AT ATG 0(30 GCA AGA TTC ACG ATG GTG CGC 576 



Til GC ° AT TTG ATG CAA AAA GAT GCT AAT GAA GTG TAT CGT TTG AAA 624 
He Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
655 660 665 

AAG CTT TCC ACT TTT CAA GAG CTT GTG AGC GTG TAT TAC GGC ATG rrr xn-> 
Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr T^r Set vlt 

670 675 680 
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720 



768 



816 



864 



912 



TTA AAC GCA GAA GTG GCT GAA ACT TTA GAA GAG GTG GAA AAA GGC CAT 
Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 
685 690 695 

TAT AAG CAT TTC CAA AAC GCT TTG AAA ATG CAA AAA GTG GGG CAA ATC 
Tyr Lys His Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin He 
700 705 710 715 

GCT AGG GTA GAA ACC TTA GGC GCT CAA GTG GCT TAT GAT AAG GCC CAT 
Ala Arg Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
720 725 730 

ATC GCT AGC GTT AAG GCT AAA GAC GTG TTA GAA GTT TCG CAG CTC TCG 
He Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
735 740 745 

TTC AAT TCC ATT TTA TCT AGC AAG GAC GAT TTA GTG CCT TCA AGC AAA 
Phe Asn Ser He Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
750 755 760 

TA GAG ATC CGC ACG GAG AAA AAT CTG CCC GAT CTG AGC TTT TTT GTT 960 
eu Glu He Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
765 770 775 

TCT TCC ACG CTC AAT TCC TAC CCG GTT TTA AAG ACT TTA GAA AAT CAG 1008 
Ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
780 785 790 795 

ATT CAA ATC TCT AAA GAA AAC ACG AAA TTA CAG ATC GCT AAA TTC TTG 
He Gin He Ser Lys Glu Asn Thr Lys Leu Gin He Ala Lys Phe Leu 
800 805 810 

CCC CAA GTG AGT TTT TTT GGC TCT TAT ATT ATG AAG CAA AAC AAT TCG 
Pro Gin Val Ser Phe Phe Gly Ser Tyr He Met Lys Gin Asn Asn Ser 
815 820 825 

GTG TTT GAA GAC ATG ATC CCT AGT TGG TTT GTG GGC GTG GCC GGG CGC 
Val Phe Glu Asp Met He Pro Ser Trp Phe Val Gly Val Ala Gly Arci 
330 835 840 

ATG CCT ATT CTT TCT CCC ACA GGG CGC ATT CAA AAA TAC CAA GCG AGC 
Met Pro He Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
845 850 855 



1056 



1104 



1152 



1200 



TTA GCG GAG TTG CAA GTG AGT AGC GAA CAA ATC CAG GCT AAA AAA 124 8 

,ys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
860 365 870 875 

^ C £ T ? ^ TTA TTA GTG AAG ACT TAT AAA Q AG ACG CTT TCT TAT 1296 

Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
SS0 885 890 

TTG AAA GAA TAC AAA AGC TTG CTT TCT AGC GTG GAA TTA GCC AAG GAA 1344 
i,eu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
395 900 905 

AAC TTA AAA CTC CAA GAG CAG GCT TTT TTA CAA GGC TTA AGC ACG AAC 13 92 

Asn Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
910 915 920 

GCT CAA GTC ATT GAT GCG AGG AAC ACG CTT TCT TCT ATC GTC GTG GAG 144 0 

Ala Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 
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925 930 935 

CAA AAA AGC GTG GCT TAT AAA TAC ATC GTT TCA TTA GCG AAT TTA ATG 1488 

Gin Lys Ser Val Ala Tyr Lys Tyr lie Val Ser Leu Ala Asn Leu Met 

940 945 950 955 

GCG TTA AGC GAT CAT ATT GAT TTA TTT TAT GAA TTT GTT TAT TAA 153 3 

Ala Leu Ser Asp His lie Asp Leu Phe Tyr Glu Phe Val Tyr * 

960 965 970 




(2) ANGABEN ZU SEQ ID NO: 20: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 511 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 20: 

et Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
15 10 15 

Leu Asn Ala Val Asp Gly lie Ser Lys Thr Asp Leu Ser Ser Leu Asn 
20 25 30 

Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
35 40 45 

Ser Leu Lys Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
50 55 60 

His Ala Gin Glu Tyr Ala lie Lys Arg Ala Ser Lys Met Lys Leu Ala 
65 70 75 80 

Ala Lys Leu Ser Phe Leu Pro Gin He Asp Leu Ser Ala Phe Tyr Val 

85 90 95 

Tyr Leu Ser Asn Pro He Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
100 105 110 

Gly Val Gin Lys Ala Thr Asn Gin He His Gin Gly He Gin Asn He 
115 120 125 

In Gin Asn He Pro Ser Gin Val Leu Thr Pro Gin He Gin Ala Gly 
130 135 140 

Met Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
145 150 155 160 

Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val He Gly Ala Leu Ser 
165 170 175 

He He Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arg 
180 185 190 

He Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
195 200 205 

Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr Tyr Gly Met Val 
210 215 220 
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Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 

235 240 



225 230 




Tyr Lys His Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin He 
245 250 255 

Ala Arq Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
260 265 270 

He Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
275 280 285 

Phe Asn Ser He Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
290 295 300 

Leu Glu He Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
305 310 315 320 

Ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
325 330 335 

e Gin He Ser Lys Glu Asn Thr Lys Leu Gin He Ala Lys Phe Leu 
340 345 350 

Pro Gin Val Ser Phe Phe Gly Ser Tyr He Met Lys Gin Asn Asn Ser 
355 360 365 

Val Phe Glu Asp Met He Pro Ser Trp Phe Val Gly Val Ala Gly Arg 
370 375 380 

Met Pro He Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
385 390 395 400 

Lys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
405 410 415 

Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
420 425 430 

Leu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
435 440 445 

sn Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
450 455 460 

Ala Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 
465 470 475 480 

Gin Lys Ser Val Ala Tyr Lys Tyr He Val Ser Leu Ala Asn Leu Met 
485 490 495 

Ala Leu Ser Asp His He Asp Leu Phe Tyr Glu Phe Val Tyr * 
500 505 510 

(2) ANGABEN ZU SEQ ID NO: 21: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 
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(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS074 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .957 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

ATG TTA AGT AGA GAC ATT GTC CAA TAT TCC AAG ATC CGC ACC GAG TTA 4 8 

Met Leu Ser Arg Asp lie Val Gin Tyr Ser Lys lie Arg Thr Glu Leu 
515 520 525 

TAC GCT TAT CTT ACC TAT TTG TTT TCG CAC AAT ATC CGC AAC CAC CTC 96 

Tyr Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn lie Arg Asn His Leu 
530 535 540 



• 

^^^^ t~* 



CCT GAA ATC ACT TTG GAT TAT TTA AAC AAA CAG ATC AGA AAA ATG CAC 144 
ro Glu lie Thr Leu Asp Tyr Leu Asn Lys Gin lie Arg Lys Met His 
545 550 555 



GCT GAA ATC AAA ATG GCA AAA AAT TTT TTT GTG TTA GAC GCT AAG GGC 192 
Ala Glu lie Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lys Gly 
560 565 570 575 

ATG CTA ATT CTT AAG CCA AGC CAG CTT AAA GAG CAG GGG CAT AAG GAA 240 
Met Leu lie Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
580 585 590 

GGG ATA TTA GAG CAT GAT TTA ACA GAA GGG ATT GAA CTA GAA TCG CAT 288 
Gly lie Leu Glu His Asp Leu Thr Glu Gly He Glu Leu Glu Ser His 
595 600 605 

GCC AGT TTT AGC GAT AAG TAT TAT TTT TAT CAA GCC GTG AGC GAA AAG 33 6 

Ala Ser Phe Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
610 615 620 

CGT TGC ATT TTA ACG GAC CCC TAT CCT TCT AAA AAA GGA AAC CAT TTA 384 
Arg Cys He Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
625 630 635 

TA GTG AGC GCG TCT TAC CCG GTG TAT GAT CAA AAT AAC GAT CTA GCG 432 
al Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
40 645 650 655 

TTT GTG GTG TGC TTG CAA ATC CCT TTG AGG GTA GCG ATT GAA ATC AGC 480 
Phe Val Val Cys Leu Gin He Pro Leu Arg Val Ala He Glu He Ser 
660 665 670 

TCG CCT TCA AAG TAT TTC AGA ACC TTT AGC GAA GGG AGC ATG GTT ATG 52 8 

Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
675 680 685 

TAT TTT ATG ATT TCT ATC ATG CTC ACT TTA GTG TCG TTG CTT TTA TTT 576 
Tyr Phe Met He Ser He Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
690 695 700 

GTG AAA TGC ATT TCT AGC TTT TGG ACA GCG ATT GTT AAT TTT AGC AGT 624 
Val Lys Cys He Ser Ser Phe Trp Thr Ala He Val Asn Phe Ser Ser 
705 710 715 
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TTT GAC ATT AAA GAA GTG TTC CAC CCC ATT GTG CTT TTA ACC CTA GCC 672 
Phe Asp lie Lys Glu Val Phe His Pro He Val Leu Leu Thr Leu Ala 
720 725 730 735 

TTA GCC ACC TTT GAT CTA GTC AAG GCG ATT TTT GAA GAG GAA GTT TTG 72 0 

Leu Ala Thr Phe Asp Leu Val Lys Ala He Phe Glu Glu Glu Val Leu 
740 745 750 

GGT AAA AAT AGC GGG GAC AAC CAC CAT GCG ATC CAC CGC ACG ATG ATC 768 
Gly Lys Asn Ser Gly Asp Asn His His Ala He His Arg Thr Met He 
755 760 765 

AGG TTT TTA GGC TCT ATC ATT ATC GCA TTA GCC ATT GAA GCG TTA ATG 816 
Arg Phe Leu Gly Ser He He He Ala Leu Ala He Glu Ala Leu Met 
770 775 780 

TTA GTG TTT AAA TTC AGC GTG AGC GAA CCG GAT AAA ATC ACT TAT GCG 864 
Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys He Thr Tyr Ala 
785 790 795 

TG TAT TTG GCT GTT GGC GTG GCG GTG CTT TTG ATC AGT TTG GCG ATT 912 
al Tyr Leu Ala Val Gly Val Ala Val Leu Leu He Ser Leu Ala He 
00 805 810 815 

TAT GTC AAA TTC GCC TAT AGC GTG TTG CCC AAA CGA GAA CGC TAA 957 
Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
820 825 830 




(2) ANGABEN ZU SEQ ID NO: 22: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 319 Aminosauren 

(B) ART: Amino saure 

( D ) TOPOLOGIE : 1 inear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Met Leu Ser Arg Asp He Val Gin Tyr Ser Lys He Arg Thr Glu Leu 
1 5 10 15 

Tyr Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn He Arg Asn His Leu 
20 25 30 

ro Glu He Thr Leu Asp Tyr Leu Asn Lys Gin He Arg Lys Met His 
35 40 45 

Ala Glu He Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lys Gly 
50 55 60 

Met Leu He Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
65 70 75 80 

Gly He Leu Glu His Asp Leu Thr Glu Gly He Glu Leu Glu Ser His 
85 90 95 

Ala Ser Phe . Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
100 105 110 



Arg Cys He Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
115 120 125 
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Val Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
130 135 140 

Phe Val Val Cys Leu Gin lie Pro Leu Arg Val Ala lie Glu He Ser 
145 150 155 160 

Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
165 170 175 

Tyr Phe Met He Ser He Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
180 185 190 

Val Lys Cys He Ser Ser Phe Trp Thr Ala He Val Asn Phe Ser Ser 
195 200 205 

Phe Asp He Lys Glu Val Phe His Pro He Val Leu Leu Thr Leu Ala 
210 215 220 

Leu Ala Thr Phe Asp Leu Val Lys Ala He Phe Glu Glu Glu Val Leu 
225 230 235 240 

ly Lys Asn Ser Gly Asp Asn His His Ala He His Arg Thr Met He 
245 250 255 

Arg Phe Leu Gly Ser He He He Ala Leu Ala He Glu Ala Leu Met 
260 265 270 . 

Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys He Thr Tyr Ala 
275 280 285 

Val Tyr Leu Ala Val Gly Val Ala Val Leu Leu He Ser Leu Ala He 
290 295 300 

Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
305 310 . 315 

(2) ANGABEN ZU SEQ ID NO: 23: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 480 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS083 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .480 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 23: 

ATG CAC TCT CCA AAT TTA GAA AAA GAA GAA ACC GAA ATC ATA GAA ACA 4 8 

Met His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu He He Glu Thr 
320 325 330 335 

CTC CTT ATG CGT GAA AAA ATG CGT TTA TGC CCC TTG TAT TGG CGC ATC 96 
Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg He 



31 





340 345 350 

TTA GCG TTT TTA ACC GAT GGT TTG TTA GTG GCG TTT TTA TTG AGC GAT 144 
Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
355 360 365 

CTT TTA GAC GCA TGC GAT TTC TTG CAT TCT TTA TAT TGG CTA GCT AAC 192 
Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
370 375 380 

CCT ATT TAT CAC AGC GCA TTT GTT GCG ATG GGT TTT ATC ATC TTG TAT 240 
Pro lie Tyr His Ser Ala Phe Val Ala Met Gly Phe lie lie Leu Tyr 
385 390 395 

GGC GTT TAT GAA ATC TTT TTT GTG TGT TTG TGC AAG ATG AGC TTG GCT 288 
Gly Val Tyr Glu lie Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 
400 405 410 415 

AAA CTG GTT TTT AGG ATT AAG ATT ATT GAT ATT TAT TTG GCA GAT TGC 336 
Lys Leu Val Phe Arg lie Lys lie lie Asp lie Tyr Leu Ala Asp Cys 
420 425 430 

CC AGT AGG GCT ATT TTA TTG AAG CGT TTA GGG TTA AAG ATC GTG GTT 384 
Pro Ser Arg Ala lie Leu Leu Lys Arg Leu Gly Leu Lys lie Val Val 
435 440 445 

TTT CTA TGC CCC TTT TTA TGG TTT GTT GCG TTT AAA AAC CCC TAT CAT 432 
Phe Leu Cys Pro Phe Leu Trp Phe Val Ala Phe Lys Asn Pro Tyr His 
450 455 460 

AGG GCG TGG CAT GAA GAA AAA AGC AAA AGT CTT TTG GTA TTG TTT TAA 480 
Arg Ala Trp His Glu Glu Lys Ser Lys Ser Leu Leu Val Leu Phe * 
465 470 475 

(2) ANGABEN ZU SEQ ID NO: 24: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 160 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

et His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu lie lie Glu Thr 
15 10 15 

Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg lie 
20 25 30 

Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
35 40 45 

Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
50 55 60 

Pro lie Tyr His Ser Ala Phe Val Ala Met Gly Phe lie lie Leu Tyr 
65 70 75 80 

Gly Val Tyr Glu lie Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 
85 90 95 
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Lys Leu Val Phe Arg lie Lys lie 
100 

Pro Ser Arg Ala lie Leu Leu Lys 
115 120 

Phe Leu Cys Pro Phe Leu Trp Phe 
130 135 

Arg Ala Trp His Glu Glu Lys Ser 
145 150 



lie Asp lie Tyr Leu Ala Asp Cys 
105 110 

Arg Leu Gly Leu Lys lie Val Val 

125.. 

Val Ala Phe Lys Asn Pro Tyr His 
140 

Lys Ser Leu Leu Val Leu Phe * 
155 160 



(2) ANGABEN ZU SEQ ID NO: 25: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 1983 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS084 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .1983 




(xi) S EQTJENZ BE SCHRE I BUNG : SEQ ID NO: 25: 

ATG ATT TAT TGG TTG TAT TTG GCG GTC TTT TTT TTG TTG AGC GCA TTA 4 8 

Met lie Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
165 170 175 

GAC GCT AAA GAA ATC GCT ATG CAA CGA TTT GAC AAA CAA AAC CAT AAG 96 
Asp Ala Lys Glu lie Ala Met Gin Arg Phe Asp Lys Gin Asn His Lys 
180 185 190 

ATT TTT GAA ATC CTT GCG GAT AAA GTG AGC GCT AAA GAC AAT GTG ATA 144 
lie Phe Glu lie Leu Ala Asp . Lys Val Ser Ala Lys Asp Asn Val lie 
195 200 205 

r ACC GCA TCA GGG AAT GCG ATC TTA TTG AAT TAT GAT GTG TAT ATT CTA 192 
Thr Ala Ser Gly Asn Ala lie Leu Leu Asn Tyr Asp Val Tyr lie Leu 
210 215 220 

GCG GAC AAG GTG CGT TAT GAC ACT AAA ACC AAA GAA GCG TTA TTA GAG 24 0 

Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
225 230 235 240 

GGG AAT ATC AAG GTT TAT AGG GGC GAG GGT TTG CTC GTT AAA ACC GAT 2 88 

Gly Asn lie Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 
245 250 255 

TAC GTG AAA TTG AGT TTG AAT GAA AAA TAT GAA ATC ATT TTC CCC TTT 336 
Tyr Val Lys Leu Ser Leu Asn Glu Lys Tyr Glu lie lie Phe Pro Phe 
260 265 270 

TAT GTC CAA GAC AGC GTG AGC GGG ATT TGG GTG AGC GCG GAT ATT GCC 3 84 
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Tyr Val Gin Asp Ser Val Ser Gly He Trp Val Ser Ala Asp He Ala 
275 280 285 

AGC GGA AAG GAT CAA AAA TAT AAG GTT AAA AAC ATG AGC ACT TCA GGG 43 2 

Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
290 295 300 

TGC AGC ATT GAT AAC CCC ATT TGG CAT GTC AAT GCG ACT TCA GGC TCA 4 80 

Cys Ser He Asp Asn Pro He Trp His Val Asn Ala Thr Ser Gly Ser 
305 310 315 320 

TTC AAC ATG CAA AAA TCG CAT TTG TCT ATG TGG AAT CCT AAG ATC TAT 52 8 

Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys He Tyr 
325 330 335 

GTC GGT GAT ATT CCT GTA TTG TAT TTG CCC TAT ATT TTC ATG TCC ACG 576 
Val Gly Asp He Pro Val Leu Tyr Leu Pro Tyr He Phe Met Ser Thr 
340 345 350 



AGC AAT AAA AGA ACT ACT GGG TTT TTA TAC CCT GAG TTT GGC ACT TCC 624 
Ser Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 
355 360 365 



C TTA GAC GGC TTT ATT TAT TTG CAA CCC TTT TAT TTA GCC CCC AAA 672 
Asn Leu Asp Gly Phe He Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
370 375 380 

AAC TCA TGG GAT ATG ACC TTT ACC CCA CAA ATC CGC TAT AAA AGG GGT 72 0 

Asn Ser Trp Asp Met Thr Phe Thr Pro Gin He Arg Tyr Lys Arg Gly 
385 390 395 400 

TTT GGC TTG AAT TTT GAA GCG CGC TAC ATT AAC TCT AAA AAC GAC AGG 768 
Phe Gly Leu Asn Phe Glu Ala Arg Tyr He Asn Ser Lys Asn Asp Arg 
405 410 415 

TTT TTA TTC AAC GCG CGC TAT TTT AGG AAT TAC ACC CAA TAT GTC AAA 816 
Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
420 425 430 

CGC TAC GAT TTG AGG AAT CAA AAT ATC TAC GGG TTT GAA TTT TTA AGC 864 
Arg Tyr Asp Leu Arg Asn Gin Asn He Tyr Gly Phe Glu Phe Leu Ser 
435 440 445 

CT AGC AGG GAC ACT TTA CAA AAA TAC TTC CAC CTT AAG TCT AAT ATT 912 
er Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn He 
450 455 460 

GAC AAC GGG CAT TAC ATT GAC TTT TTA TAC ATG AAC GAT TTG GAC TAT 960 
Asp Asn Gly His Tyr He Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
465 470 475 480 

GTG CGT TTT GAA AAG GTT AAT AAG CGT ATC ACA GAC GCC ACG CAC ATG 1008 
Val Arg Phe Glu Lys Val Asn Lys Arg He Thr Asp Ala Thr His Met 
485 490 495 

TCT AGG GCG AAT TAC TAT TTG CAA ACA GAA AAC AAT TAT TAC GGC TTG 105 6 

Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
500 505 510 

AAT ATC AAG TAT TTT TTA AAC CTG AAT AAA ATC AAC AAT AAC CGC ACT 1104 
Asn He Lys Tyr Phe Leu Asn Leu Asn Lys He Asn Asn Asn Arg Thr 
515 520 525 
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TTC CAA TCT GTC CCT AAT TTG CAA TAC CAT AAA TAT TTA AAT TCT TTG 1152 
Phe Gin Ser Val Pro Asn Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu 
530 535 540 

TAT TTT AGA AAT TTG TTG TAT TCG GTG GAT TAT CAG TTT AGA AAC ACC 12 0 0 

Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
545 550 555 560 

GCA AGA GAG ATT GGT TAT GGC TAT GTG CAA AAC GCT TTG AAT GTG CCG 12 4 8 

Ala Arg Glu lie Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
565 570 575 

GTG GGC TTG CAA TTT TCT TTG TTT AAA AAG TAT TTG TCT TTA GGG CTT 1296 
Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
580 585 590 

TGG AAT GAT CTC CAA CTA TCT AAT GTG GCT TTA ATG CAA TCT AAA AAT 1344 
Trp Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
595 600 605 

TCC TTC GTG CCT ACG ATC CCT AAT GAA TCA AGG GAA TTT GGG AAT TTT 13 92 

er Phe Val Pro Thr lie Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
610 615 620 

GTG TCT TCA AAT TTT TCC ATG TAT GTC AAT ACG GAT TTG GCT AGA GAA 144 0 

Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
625 630 635 640 

TAC AAC AAG CTT TTC CAC ACG ATC CAA CTA GAA GCG ATT TTC AAC ATC 14 88 

Tyr Asn Lys Leu Phe His Thr lie Gin Leu Glu Ala He Phe Asn He 
645 650 655 

CCT TAT TAC ACC TTT AAA AAC GGC TTA TTT TCT CAA AAC ATG TAT GCT 153 6 

Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
660 665 670 

TTA AGC GCG CAA GCC TTA AAC AGC TAC ACT TCG CCT TTA TTG AGA GAT 1584 
Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 
675 680 685 

TAT GAT TAT CAA GGG CGT TTG TAT GAC TCG GTG TGG AAT CCT AGC AGT 1632 
Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
690 695 700 

TT TTA CCT AGC AAT GCG AGC AAC AAG ACG' GTG GAT TTA ACC CTA ACG 1680 
le Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
705 710 715 720 

CAA TAC CTT TAT GGC TTA GGG GGG CAA GAG TTA TTG TAT TTT AAA ATA 172 8 

Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys He 
725 730 735 

TCG CAA CTC ATC AAT CTT GAC GAT AAA GTT TCG CCC TTT AGA ATG CCA 1776 
Ser Gin Leu He Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
740 745 750 

CTA GAG AGC AAG ATC GGG TTT TCG CCC TTA ACG GGA TTG AAC ATC TTT 1824 
Leu Glu Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe 
755 760 765 

GGG AAT GTC TTT TAT TCG TTT TAT CAA AAC CGC TTA GAA GAA ATC TCT 1872 
Gly Asn Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu He Ser 
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770 775 780 

GTG AAC GCC AAT TAC CAA CGC AAG TTT TTA AGC TTT AAC CTC TCT TAT 192 0 

Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu Ser Tyr 
785 790 795 800 

TTT TTA AAA AAC AAT TTT AGC AGT GGG ATT AAT AGC ATT GTA GAA AAT 196 8 

Phe Leu Lys Asn Asn Phe Ser Ser Gly lie Asn Ser lie Val Glu Asn 
805 810 815 

CTG CGG ATT ATT TAA 19 83 

Leu Arg lie lie * 
820 

(2) ANGABEN ZU SEQ ID NO: 26: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 661 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Met lie Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
15 10 15 

Asp Ala Lys Glu lie Ala Met Gin Arg Phe Asp Lys Gin Asn His Lys 
20 25 30 

lie Phe Glu lie Leu Ala Asp Lys Val Ser Ala Lys Asp Asn Val lie 
35 40 45 

Thr Ala Ser Gly Asn Ala lie Leu Leu Asn Tyr Asp Val Tyr lie Leu 
50 55 60 

Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
65 70 75 80 

Gly Asn lie Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 
85 90 95 



yr Val Lys Leu Ser Leu Asn Glu Lys Tyr Glu lie lie Phe Pro Phe 
1<& 105 110 



Tyr Val Gin Asp Ser Val Ser Gly lie Trp Val Ser Ala Asp lie Ala 
115 120 125 

Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
130 135 140 

Cys Ser lie Asp Asn Pro lie Trp His Val Asn Ala Thr Ser Gly Ser 
145 150 155 160 

Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys lie Tyr 
165 170 175 

Val Gly Asp lie Pro Val Leu Tyr Leu Pro Tyr lie Phe Met Ser Thr 
180 185 190 

Ser Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 
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195 200 205 

Asn Leu Asp Gly Phe lie Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
210 215 220 

Asn Ser Trp Asp Met Thr Phe Thr Pro Gin lie Arg Tyr Lys Arg Gly 
225 230 235 240 

Phe Gly Leu Asn Phe Glu Ala Arg Tyr lie Asn Ser Lys Asn Asp Arg 
245 250 255 

Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
260 265 270 

Arg Tyr Asp Leu Arg Asn Gin Asn lie Tyr Gly Phe Glu Phe Leu Ser 
275 280 285 

Ser Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn lie 
290 295 300 

Asp Asn Gly His Tyr lie Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
"05 310 315 320 

al Arg Phe Glu Lys Val Asn Lys Arg lie Thr Asp Ala Thr His Met 
325 330 335 

Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
340 345 350 

Asn lie Lys Tyr Phe Leu Asn Leu Asn Lys lie Asn Asn Asn Arg Thr 
355 360 365 

Phe Gin Ser Val Pro Asn Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu 
370 375 380 

Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
385 390 395 400 

Ala Arg Glu lie Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
405 410 415 

Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
420 425 430 

rp Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
435 440 445 

Ser Phe Val Pro Thr lie Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
450 455 460 

Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
465 470 475 480 

Tyr Asn Lys Leu Phe His Thr lie Gin Leu Glu Ala lie Phe Asn lie 
485 490 495 

Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
500 505 510 

Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 
515 520 525 



37 



Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
530 535 540 

lie Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
545 550 555 560 

Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys lie 
565 570 575 

Ser Gin Leu lie Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
580 585 590 

Leu Glu Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe 
595 600 605 

Gly Asn Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu He Ser 
610 615 620 

Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu Ser Tyr 
625 630 635 640 

he Leu Lys Asn Asn Phe Ser Ser Gly He Asn Ser He Val Glu Asn 
645 650 655 

Leu Arg He He * 
660 

(2) ANGABEN ZU SEQ ID NO: 27: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 3 72 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPC085 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..372 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 

ATG CGT TTG TTT ATC TCA CTA GTT TTG TTT TGG TGG TGG TTA AGT TTG 4 8 

Met Arg Leu Phe He Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
665 670 675 

AAC GCT AAA GAA GCG GAT TTC ATC TCT GAT TTG GAA TAC GGG ATG GCT 96 
Asn Ala Lys Glu Ala Asp Phe He Ser Asp Leu Glu Tyr Gly Met Ala 
680 685 630 

CTT TAT AAA AAC CCT AGG GGT GTT GCG TGC GCG AAA TGC CAT GGC ATT 144 
Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly He 
695 700 705 

AAA GGC GAA CAA CAA GAA ATC ACT TTT TAT TAT GAA AAA GGC GAA AAA 192 
Lys Gly Glu Gin Gin Glu He Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
710 715 720 725 
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AAA ATC CTC TAC GCC CCT AAA ATC AAC CAT TTA GAT TTT AAA ACC TTT 

Lys lie Leu Tyr Ala Pro Lys lie Asn His Leu Asp Phe Lys Thr Phe 
730 735 740 

AAA GAC GCC CTG AGT TTA GGC AAA GGC ATG ATG CCT AAA TAC AAT CTC 
Lys Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 
745 750 755 

AAT TTA GAA GAA ATC CAA GCG ATT TAC CTT TAC ATC ACC TCT TTA GAG 
Asn Leu Glu Glu lie Gin Ala lie Tyr Leu Tyr lie Thr Ser Leu Glu 
760 765 770 

CAT AAA GAC GAG CAT AAG AAT CCT TCC AAG CCT TAA 
His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
77.5 780 785 

(2) ANGABEN ZU SEQ ID NO: 28: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 124 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 

Met Arg Leu Phe lie Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
15 10 15 

Asn Ala Lys Glu Ala Asp Phe lie Ser Asp Leu Glu Tyr Gly Met Ala 
20 25 30 

Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly lie 
35 40 45 

Lys Gly Glu Gin Gin Glu lie Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
50 55 60 

Lys lie Leu Tyr Ala Pro Lys lie Asn His Leu Asp Phe Lys Thr Phe 
65 70 75 80 

Lys Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 
85 90 95 

r Asn Leu Glu Glu lie Gin Ala lie Tyr Leu Tyr He Thr Ser Leu Glu 
100 105 110 

His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
115 120 

(2) ANGABEN ZU SEQ ID NO: 29: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 558 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
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(B) CLON(E) : HPC090 

(ix) MERKMAL: 

(A) NAME / SCHLUSSEL : CDS 

(B) LAGE : 1 . .558 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 

ATG CGT TGG TGG TGT TTT TTG GTG TGT TGT TTT GGT ATT TTA AGC GTG 

Se? Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly He Leu Ser Val 
125 130 

ATG GAC GCT CAA AAA ACA GAC AAT AAA GGT TTG AAA AAA GAA AGA GAA 

Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 

150 155 



145 



n 



160 



225 




48 



96 



CTT TTA GAA ATT ACT GGC AAC CAA TTT GTA GCG AAC GAC AAA ACC AAA 144 
Leu Leu Glu He Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 

165 170 



192 



240 



CC GCC GTT ATT CAA GGC AAT GTG CAG ATC AAA AAA GGT AAA GAC CGG 
£r til Val lie Gin Gly Asn Val Gin He Lys Lys Gly Lys Asp Arg 
175 180 185 

TTG TTT GCG GAT AAG GTG AGC GTG TTT TTA AAC GAT AAA CGA AAG CCA 
Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
190 195 200 

GAG CGC TAT GAA GCC ACA GGG AAC ACQ CAT TTT AAC ATC TTT ACA GAG 288 

Glu Arg Tyr Glu Ala Thr Gly Asn Thr Hxs Phe Asn He Phe Thr Glu 
205 210 215 

GAC AAT CGT GAA ATC AGC GGG AGC GCT GAC AAG CTC ATT TAT AAC GCA 336 

Sp J£ A?g Glu lie Ser Gly Ser Ala Asp Lys Leu lie Tyr Asn Ala 

* 230 23b 



TTG AAT GGG GAA TAC AAA TTA TTG CAA AAT GCG GTG GTT AGA GAA GTG 384 
Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg . Glu Val 
240 245 250 

GGG AAA TCT AAT GTC ATC ACT GGC GAT GAA ATC ATT TTA AAC AAA ACT 
,Gly Lys Ser Asn Val He Thr Gly Asp Glu He He Leu Asn Lys Thr 
^ 255 260 265 

AAG GGT TAT GCT GAT GTG TTA GGG AGC GCG AAA CGG CCC GCT AAA TTC 
Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 
270 275 280 

GTG TTT GAT ATG GAA GAT ATT AAT GAA GAA AAT CGT AAG GCT AAA TTG 
Val Phe Asp Met Glu Asp He Asn Glu Glu Asn Arg Lys Ala Lys Leu 
285 290 295 300 

AAG AAG AAA GGC ACT AAG GAA AAA CCA TGA 
Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
305 310 

(2) ANGABEN ZU SEQ ID NO: 30: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 186 Aminosauren 



432 



480 



528 



558 




(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 30: 

Met Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly lie Leu Ser Val 
1 5 10 15 

Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 
20 25 30 

Leu Leu Glu lie Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 
35 40 45 

Thr Ala Val lie Gin Gly Asn Val Gin lie Lys Lys Gly Lys Asp Arg 
50 55 60 

Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
65 70 75 80 

lu Arg Tyr Glu Ala Thr Gly Asn Thr His Phe Asn lie Phe Thr Glu 
85 90 95 

Asp Asn Arg Glu lie Ser Gly Ser Ala Asp Lys Leu lie Tyr Asn Ala 
100 105 110 

Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg Glu Val 
115 120 125 

Gly Lys Ser Asn Val lie Thr Gly Asp Glu lie lie Leu Asn Lys Thr 
130 135 140 

Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 
145 150 155 160 

Val Phe Asp Met Glu Asp lie Asn Glu Glu Asn Arg Lys Ala Lys Leu 
165 170 175 

Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
180 185 



(2) ANGABEN ZU SEQ ID NO: 31: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 768 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS104 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .768 



(Xi) 



SEQUENZBESCHREIBUNG: SEQ ID NO : 31: 



ATG GAT ATT TAT GCG TTA TAT ATA GCG ATA GGG CTT TTT ACT GGC ATT 
Met Asp lie Tyr Ala Leu Tyr lie Ala lie Gly Leu Phe Thr Gly lie 
190 195 200 

CTA TCA GGG ATT TTT GGC ATT GGT GGG GGG TTG ATC ATT GTC CCT ATC 
Leu Ser Gly He Phe Gly He Gly Gly Gly Leu He He Val Pro He 
205 210 215 

ATG CTC GCA ACC GGG CAT TCT TTT GAA GAA TCC ATT GGG ATT TCC ATT 
Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser He Gly He Ser He 
220 225 230 

TTG CAA ATG GCG CTT TCA TCG TTC GTG GGC TCT GTT TTG AAT TTC AAA 
Leu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
235 240 245 250 

AAA AAA TCG CTT GAT TTT TCT TTA GGC TTG TTG ATA GGG GCA GGG GGG 
Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Gly 
255 260 265 



CTG ATA GGG GCG AGT TTT AGC GGA TTT GTT TTA AAA ATC GTT TCC AGT 
eu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
270 275 280 




AAA ATT TTA ATG GTT ATT TTC GCG CTT TTA GTC GTG TAT TCT ATG ATC 
Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
285 290 295 

CAA TTT GTT TTG AAA CCC AAA AAA AAA GAT TTG ATA GCG GAT ACT AAA 
Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
300 305 310 

CGC TAT CAT CTG CAA GGT TTG AAA TTA TTT TTA ATT GGC ACG CTC ACA 
Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
315 320 325 330 

GGG TTT TTT GCT ATC ACT TTA GGG ATT GGT GGG GGG ATG CTC ATG GTG 
Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
335 340 345 

CCT TTG ATG CAT TAT TTT TTA GGG TAT GAT TCT AAA AAA TGC GTG GCT 
Pro Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 
350 355 360 

TA GGG TTA TTT TTC ATC TTG TTT TCT TCT ATT TCA GGA GCT TTT TCT 
Leu Gly Leu Phe Phe He Leu Phe Ser Ser He Ser Gly Ala Phe Ser 
365 370 375 

TTA ATG TAT CAC CAC ATC ATC AAT AAA GAA GTG CTC TTA GCA GGG GCG 
Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
380 385 390 

ATT GTG GGA TTA GGA TCT GTT ATG GGC GTG AGC ATT GGG ATT AAA TGG 
He Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trp 
395 400 405 410 

ATC ATG GGG CTT TTG AAT GAA AAA ATG CAT AAA GCT TTG ATT TTA GGG 
He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 
415 420 425 



GTG TAT GGT TTG TCG CTA TTG ATT GTT TTA TAC AAA CTC TTT TTT TAA 
Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 
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430 435 440 

(2) ANGABEN ZU SEQ ID NO: 32: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 256 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

Met Asp lie Tyr Ala Leu Tyr lie Ala lie Gly Leu Phe Thr Gly lie 
15 10 15 

Leu Ser Gly lie Phe Gly lie Gly Gly Gly Leu lie lie Val Pro lie 
20 25 30 

Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser lie Gly lie Ser He 
35 40 45 

eu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
50 55 60 

Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Gly 
65 70 75 80 

Leu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
85 90 95 

Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
100 105 110 

Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
115 120 125 

Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
130 135 140 

Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
145 150 155 160 

ro Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 
165 170 175 

Leu Gly Leu Phe Phe He Leu Phe Ser Ser lie Ser Gly Ala Phe Ser 
180 185 190 

Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
195 200 205 

He Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trp 
210 215 220 

He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 
225 230 235 240 

Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 
245 250 255 
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(2) ANGABEN ZU SEQ ID NO: 33: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 2367 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS115 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..2367 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 

ATG AAA TGT TCG CAT TGC CAG TTG GAG TTT AAA GAA AGT GAG CTT TTT 48 
^Iet Lys Cys Ser His Cys Gin Leu Glu Phe Lys Glu Ser Glu Leu Phe 
260 265 270 

AAA GAG GTG ATC AAT CAT AAA GAA TTG CAT TTT TGC TGC ACG GGG TGC 96 
Lys Glu Val lie Asn His Lys Glu Leu His Phe Cys Cys Thr Gly Cys 
275 280 285 

GCT AGG GTG TAT GCG TTA TTG TTA GAT TTG AAT TTA GAG AGC TTT TAT 144 
Ala Arg Val Tyr Ala Leu Leu Leu Asp Leu Asn Leu Glu Ser Phe Tyr 
290 295 300 

GAC AAA TTA AAC GAT TCC ACT TTA GCC CCC GTA ACG CCC CAA GAT TCA 192 
Asp Lys Leu Asn Asp Ser Thr Leu Ala Pro Val Thr Pro Gin Asp Ser 
305 310 315 320 

ATG AGC GCT TTG GAA TTA GAA CAA GCC CTT GAA GAA AAC AAT AAG GGC 24 0 

Met Ser Ala Leu Glu Leu Glu Gin Ala Leu Glu Glu Asn Asn Lys Gly 
325 330 335 

GAT TTT ATC CTT AAT CTT TTG TTA GAA AAA ACG CAT TGT AAC GCT TGC 288 
Asp Phe lie Leu Asn Leu Leu Leu Glu Lys Thr His Cys Asn Ala Cys 
340 345 350 

TG TGG CTC AAT CAA AAG GTT TTA GAA CGT TTA AGT GGG GTT AAA AAA 336 
eu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
355 360 365 

GTG AGC GTG AAT TTC ACC ACC CAC CAC TTG CAA ATC GTG TTT GAG AAG 3 84 

Val Ser Val Asn Phe Thr Thr His His Leu Gin lie Val Phe Glu Lys 
370 375 380 

TCC TTA AAC CCT AAA GAG ATT ATT CAA AAA ATT GAG AGT TTG GGC TAT 432 
Ser Leu Asn Pro Lys Glu lie lie Gin Lys lie Glu Ser Leu Gly Tyr 
385 ' 390 395 400 

GGG GCT AAA ATT TAT AAT GCG CAA AAT TAC ACC CTA AAA GCG CAA AAA 480 
Gly Ala Lys lie Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
405 410 415 

GAA CAG CGC TCC TAC TTG CTC ACT TTG AGC GTG GGG TTT TTT GCC ACT 528 
Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 



420 



425 
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ATG AAT TTG ATG TTT ATC GCC ATT GCC AAA TAC GCA AGT TAT GGT GGC 
Met Asn Leu Met Phe lie Ala lie Ala Lys Tyr Ala Ser Tyr Gly Gly 
435 440 445 

GCA AGT TAT GGC GGT GCG AAT TAT GGC GCT GGC ATG GAT AAG CTT ATG 
Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
450 455 460 

CAA AGG AAT TTG GAT CTC GTA TCG CTC TTT TTA AGC TTG TTG GTG TTA 
Gin Arg Asn Leu Asp Leu Val Ser Leu Phe Leu Ser Leu Leu Val Leu 
465 470 475 480 

GTG GTT GTG GGG CGT TTT TTC ATT AAG GGG GCG TTT TAT GGG CTA AAA 
Val Val Val Gly Arg Phe Phe lie Lys Gly Ala Phe Tyr Gly Leu Lys 
485 490 495 



ft 



AAT GGC GTT TTG GGC ATG GAT TTG AGC GTG TCT TTT GGA GCG TTA TCG 
Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
500 505 510 



CG TTT GTT TAT TCC GTT TAT GCC ATG TTG GTG TCC CAA GAG ACT TAT 
Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
515 520 525 

TTT GAA GCG AGC AGC ACG ATT CTA ACG CTT GTT TTT GGC TCT AAG TTT 
Phe Glu Ala Ser Ser Thr lie Leu Thr Leu Val Phe Gly Ser Lys Phe 
530 535 540 

TTG GAA TTA AAA GCC AGG CTG TTT GCG AAT GAA AAA TGT CTG GCC CTA 
Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
545 550 555 560 

GAA TCG CAT GAA ATC CAT AGC GTG ATC GTT GTA GAA AAT GGC AAG CAA 
Glu Ser His Glu lie His Ser Val lie Val Val Glu Asn Gly Lys Gin 
565 570 575 

ACA GAA AAA CAC CCT AAA GAT GTG GCG ATA GGC TCT GTT GTT TGG GTG 
Thr Glu Lys His Pro Lys Asp Val Ala lie Gly Ser Val Val Trp Val 
580 585 590 
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CCA AGC GGG GCT AAA ATC GCA CTA GAT GGC GTG CTT TTA AAT AAT GCG 
ro Ser Gly Ala Lys lie Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
595 600 605 



AGC GTG GAT GCG TCT TTG ATC AGT GGG GAG TTT AAG CCT TTG GAA TTG 
Ser Val Asp Ala Ser Leu lie Ser Gly Glu Phe Lys Pro Leu Glu Leu 
610 615 620 

GGG GTT AAT GAT CCA ATT TTA GGG GGT TAT GTG AAT GTG GGC GTG CCT 
Gly Val Asn Asp Pro lie Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
625 630 635 640 

TTT AGC TAT CAA GTG AGC GCT AAT TTT CAA AAC TCA CGC CTT TCT GGT 
Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
645 650 655 

TTG TTA GAA ACT TTA AAA AAG AGT TTT TTA GAA AAG CCC TTA ATT GAG 
Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu lie Glu 
660 665 670 
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AGT AGC GCG AAT CAA ATT GCG GAT ATT TTT TCT AAA GCG GTG TTG TTT 12 96 

Ser Ser Ala Asn Gin lie Ala Asp lie Phe Ser Lys Ala Val Leu Phe 
675 680 685 

TTA GCC TTT GTA AGC TTT TTG TTA TGG CAA TTT GGT TTG GGG GGT AAT 1344 
Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
690 695 700 

TTT GAA AAA GCC TTA ATG GTG TGT ATT AGC GTG CTA GTC ATC AGC TGC 13 92 

Phe Glu Lys Ala Leu Met Val Cys lie Ser Val Leu Val lie Ser Cys 
705 710 715 720 

CCT TGC GCG TTC GCT CTG GCT ACG CCC ATT GCG TTA GTG ATA GGG GTG 144 0 

Pro Cys Ala Phe Ala Leu Ala Thr Pro lie Ala Leu Val lie Gly Val 
725 730 735 

TTT AAA AAC CCT TTG ATC GTG TTT AAA GAA GCG TTG TTT TTA GAA ACT 14 88 

Phe Lys Asn Pro Leu lie Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
740 745 750 



CTG GCT AAA GTG AAA AAA ATC TTT ATA GAC AAA ACC GGC ACG CTC ACG 153 6 

fjeu Ala Lys Val Lys Lys lie Phe lie Asp Lys Thr Gly Thr Leu Thr 
755 760 765 



CAA AAA GAA GTC CTT TTA AAA GAA AAA ATC ATT TAT GAA GAA TTT GAT 1584 
Gin Lys Glu Val Leu Leu Lys Glu Lys lie lie Tyr Glu Glu Phe Asp 
770 775 780 

GGA AGG CTT TTG AAG AGC CTT TTA AAA GTG AGA GAG CAT TTA GCC CAT 1632 
Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
785 790 795 800 

AGC GCG ATT CTT AAA TCT CTA GAT GGC GAT GAG GTT AGT TTA GAA AAG 1680 
Ser Ala lie Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
805 810 815 

ATA GAG TTT TTC GCT CAT GGT CTG AAA GCG AGC TAT CAA AAC GAA ACC 1728 
lie Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
820 825 830 

CTG CTA GTG GGG AGT TTG AAA TTT TTG GGA TCT ATG GGG GTG GAT ATA 1776 
Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp lie 
835 840 845 

CA ATG AAA GAG AGC GCT AAT ATC ATG GTA GGC TTT GCG AAA AAT GAG 1824 
ro Met Lys Glu Ser Ala Asn lie Met Val Gly Phe Ala Lys Asn Glu 
850 855 860 

ACT TTA TGC GCG TTA TTC ATT TTA GAA GAG CGT TTG AAA GCT AAC GCT 1872 
Thr Leu Cys Ala Leu Phe lie Leu Glu Glu Arg Leu Lys Ala Asn Ala 
865 870 875 880 

AAA GAA GTC GTT CAG GCT TTA CAA AAT AAA GGC TTA GAA TTA GAG ATT 192 0 

Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu He 
885 890 895 

TTA AGC GGG GAT AAT GAA AGC TCG GTT AAG GAG TGC GCG AAA AAA TTA 1968 
Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
900 905 910 

GGG ATT TCT AAT TAT CAT GCC CAT TTG ACC CCT GAA GAT AAG GCT CAA 2 016 

Gly He Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 
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915 920 925 

ACC ATC AGC TCT TAT AAG GGC GTT TGC GCG ATG GTA GGC GAT GGC AAT 2064 
Thr lie Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 
930 935 940 

AAT GAT GCG TTA GCC TTA AAA CAA GCG AGC GTT TCT TTA GGG TTT GAA 2112 
Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 
945 950 955 960 

AAA AGC GCT TTG AGT AAA AGC GCA TGC GAT ATT TTG CTT TTA GAA GAG 2160 
Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp lie Leu Leu Leu Glu Glu 
965 970 975 

GAT TTG AGT TTG CTA AAA AAA GCG TTT GAT AAC GCT CAA AAA GTC TAT 22 08 

Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 
980 985 990 

CAA GTG GTG TTG CAA AAC ATT GTT TTG AGC TTG ATT TAT AAC GCT ATT 2256 
Gin Val Val Leu Gin Asn lie Val Leu Ser Leu lie Tyr Asn Ala lie 
995 1000 1005 




'A ATC CCG GTC GCT ATG CTA GGA TAC ATT AAC CCT TTA ATA GCG AGT 23 04 

JLeu lie Pro Val Ala Met Leu Gly Tyr lie Asn Pro Leu lie Ala Ser 
1010 1015 1020 

TTG AGC ATG AGC GCT AGC TCA CTC TTA GTG GTC TTA AAT TCT TTG AGG 2352 
Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
1025 1030 1035 1040 

TTG AAA CGC TCT TAA 23 67 

Leu Lys Arg Ser * 

1045 

(2) ANGABEN ZU SEQ ID NO: 34: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 789 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

ftet Lys Cys Ser His Cys Gin Leu Glu Phe Lys Glu Ser Glu Leu Phe 
15 10 15 

Lys Glu Val lie Asn His Lys Glu Leu His Phe Cys Cys Thr Gly Cys 
20 25 30 

Ala Arg Val Tyr Ala Leu Leu Leu Asp Leu Asn Leu Glu Ser Phe Tyr 
35 40 45 

Asp Lys Leu Asn Asp Ser Thr Leu Ala Pro Val Thr Pro Gin Asp Ser 
50 55 60 

Met Ser Ala Leu Glu Leu Glu Gin Ala Leu Glu Glu Asn Asn Lys Gly 
65 70 75 80 



Asp Phe lie Leu Asn Leu Leu Leu Glu Lys Thr His Cys Asn Ala Cys 

85 90 95 



Leu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
100 105 110 

Val Ser Val Asn Phe Thr Thr His His Leu Gin lie Val Phe Glu Lys 
115 120 125 

Ser Leu Asn Pro Lys Glu lie lie Gin Lys lie Glu Ser Leu Gly Tyr 
130 135 140 

Gly Ala Lys lie Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
145 150 155 160 

Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 
165 170 175 

Met Asn Leu Met Phe lie Ala lie Ala Lys Tyr Ala Ser Tyr Gly Gly 
180 185 190 

Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
195 200 205 

In Arg Asn Leu Asp Leu Val Ser Leu Phe Leu Ser Leu Leu Val Leu 
210 215 220 

Val Val Val Gly Arg Phe Phe lie Lys Gly Ala Phe Tyr Gly Leu Lys 
225 230 235 240 

Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
245 250 255 

Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
260 265 270 

Phe Glu Ala Ser Ser Thr He Leu Thr Leu Val Phe Gly Ser Lys Phe 
275 280 285 

Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
290 295 300 

Glu Ser His Glu He His Ser Val He Val Val Glu Asn Gly Lys Gin 
305 310 315 320 

Thr Glu Lys His Pro Lys Asp Val Ala He Gly Ser Val Val Trp Val 
325 330 335 

o Ser Gly Ala Lys He Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
340 345 350 

Ser Val Asp Ala Ser Leu He Ser Gly Glu Phe Lys Pro Leu Glu Leu 
355 360 365 

Gly Val Asn Asp Pro He Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
370 375 380 

Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
385 390 395 400 

Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu He Glu 
405 410 415 

Ser Ser Ala Asn Gin He Ala Asp He Phe Ser Lys Ala Val Leu Phe 
420 425 430 
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Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
435 440 445 

Phe Glu Lys Ala Leu Met Val Cys lie Ser Val Leu Val lie Ser Cys 
450 455 460 

Pro Cys Ala Phe Ala Leu Ala Thr Pro lie Ala Leu Val He Gly Val 
465 470 475 480 

Phe Lys Asn Pro Leu He Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
485 490 495 

Leu Ala Lys Val Lys Lys He Phe He Asp Lys Thr Gly Thr Leu Thr 
500 505 510 

Gin Lys Glu Val Leu Leu Lys Glu Lys He He Tyr Glu Glu Phe Asp 
515 520 525 

Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
530 535 540 

er Ala He Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
45 550 555 560 

He Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
565 570 575 

Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp He 
580 585 590 

Pro Met Lys Glu Ser Ala Asn He Met Val Gly Phe Ala Lys Asn Glu 
595 600 605 

Thr Leu Cys Ala Leu Phe He Leu Glu Glu Arg Leu Lys Ala Asn Ala 
610 615 620 

Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu He 
625 630 635 640 

Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
645 650 655 

Gly He Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 
660 665 670 

r He Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 
675 680 685 

Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 
690 695 700 

Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp He Leu Leu Leu Glu Glu 
705 710 715 720 

Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 
725 730 735 

Gin Val Val Leu Gin Asn He Val Leu Ser Leu He Tyr Asn Ala He 
740 745 750 

Leu He Pro Val Ala Met Leu Gly Tyr He Asn Pro Leu He Ala Ser 
755 760 765 
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Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
770 775 780 

Leu Lys Arg Ser * 
785 

(2) ANGABEN ZU SEQ ID NO: 35: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 751 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS120 

( ix) MERKMAL : 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..2751 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: 

ATT AAA AAA TTA ATT CTA TCC TCT CTT GTT TTC GCA TGT ATC AAT ACC 4 8 

lie Lys Lys Leu lie Leu Ser Ser Leu Val Phe Ala Cys lie Asn Thr 
790 795 800 805 

AGC GTT GAA GCT TTA GAA AAT GAC GGC TCT AAA CCA AAC GAT TTG ACT 96 
Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
810 815 820 

TCT CCA AAA GAA GCC TCT CAA GAA TCT CAA AAA AAT GAA GCT CCA AAA 144 
Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
825 830 835 

AAT GAA GTT CAA AGA AAT GAA GCT CAA AAA GAA ACC CCC CAA TCC AAT 192 
Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
840 845 850 



CAA ACG CCT AAA GAA ATG AAA GTC AAG TCC ATT TCT TAT GTC GGG CTT 240 
n Thr Pro Lys Glu Met Lys Val Lys Ser lie Ser Tyr Val Gly Leu 
855 860 865 



TCT TAC ATG TCT GAC ATG CTC GCT AAT GAA ATT GTA AAG ATT CGT GTG 2 88 

Ser Tyr Met Ser Asp Met Leu Ala Asn Glu lie Val Lys lie Arg Val 
870 875 880 885 

GGC GAT ATT GTG GAT TCT AAA AAA ATA GAC ACC GCT GTT TTG GCT TTG 33 6 

Gly Asp lie Val Asp Ser Lys Lys He Asp Thr Ala Val Leu Ala Leu 
890 895 900 

TTC AAT CAA GGG TAT TTT AAA GAC GTT TAT GCC ACT TTT GAA GGC GGC 3 84 

Phe Asn Gin Gly Tyr Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
905 910 915 

ATA TTA GAG TTT CAT TTT GAT GAA AAA GCC AGG ATT GCC GGG GTA GAA 432 
He Leu Glu Phe His Phe Asp Glu Lys Ala Arg lie Ala Gly Val Glu 
920 925 930 
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ATC AAG GGT TAT GGG ACT GAA AAG GAA AAA GAC GGC TTA AAA TCC CAA 480 
lie Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 
935 940 945 

ATG GGG ATC AAA AAG GGC GAC ACC TTT GAT GAG CAA AAA TTA GAG CAT 52 8 

Met Gly lie Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 
950 955 960 965 

GCT AAA ACG GCT TTA AAA ACC GCT TTA GAG GGG CAG GGC TAT TAT GGG 576 
Ala Lys Thr Ala Leu Lys Thr Ala Leu Glu Gly Gin Gly Tyr Tyr Gly 
970 975 . 980 

AGC GTG GTG GAG GTG CGC ACA GAA AAG GTC AGT GAG GGT GCA TTA TTG 624 
Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 
985 990 995 

ATC GTG TTT GAT GTG AAT AGG GGG GAT AGC ATT TAT ATC AAA CAA TCC 672 
lie Val Phe Asp Val Asn Arg Gly Asp Ser lie Tyr lie Lys Gin Ser 
1000 1005 1010 

TT TAT GAG GGA AGC GCG AAA TTA AAA CGC CGC ATG ATT GAA TCT TTG 720 
lie Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met lie Glu Ser Leu 
1015 1020 1025 

AGT GCG AAC AAG CAA CGA GAT TTC ATG GGC TGG ATG TGG GGC TTG AAT 768 
Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
1030 1035 1040 1045 

GAC GGG AAA TTG CGT TTA GAT CAA CTA GAA TAC GAT TCT ATG CGT ATC 816 
Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg lie 
1050 1055 1060 

CAA GAT GTG TAT ATG CGT AGG GGT TAC TTA GAC GCT CAT ATT TCT TCG 864 
Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His lie Ser Ser 
1065 1070 1075 

CCT TTT TTG AAA ACG GAT TTT TCT ACC CAT GAC GCT AAG CTT CAT TAT 912 
Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
1080 1085 1090 

AAA GTC AAA GAG GGG ATC CAA TAC AGG ATT TCA GAC ATT TTA ATA GAG 960 
Lys Val Lys Glu Gly lie Gin Tyr Arg lie Ser Asp lie Leu lie Glu 
1095 1100 1105 

T GAC AAC CCG GTA GTC CCC TTA AAA ACC TTA GAA AAA GCG CTT AAA 1008 
e Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
1110 1115 1120 1125 

GTG AAA AGG AAA GAT GTC TTT AAT ATT GAG CAT TTA AGA GCG GAT GCG 1056 
Val Lys Arg Lys Asp Val Phe Asn lie Glu His Leu Arg Ala Asp Ala 
1130 1135 1140 

CAA ATT TTA AAA ACC GAA ATC GCC GAT AAG GGT TAT GCG TTT GCG GTG 1104 
Gin lie Leu Lys Thr Glu lie Ala Asp Lys Gly Tyr Ala Phe Ala Val 
1145 1150 1155 

GTG AAG CCA GAC TTG GAT AAA GAT GAA AAA AAC GGG CTT GTG AAA GTC 1152 
Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
1160 1165 1170 

ATT TAT CGT ATT GAA GTG GGC GAT ATG GTG TAT ATC AAT GAT GTC ATC 1200 
lie Tyr Arg lie Glu Val Gly Asp Met Val Tyr lie Asn Asp Val lie 
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1175 1180 1185 

ATT TCA GGG AAC CAG CGC ACG AGC GAT AGG ATC ATT AGA AGG GAG TTA 124 8 

He Ser Gly Asn Gin Arg Thr Ser Asp Arg He He Arg Arg Glu Leu 

1190 1195 1200 1205 

TTG TTA GGG CCT AAG GAT AAA TAC AAC TTG ACC AAA CTG AGA AAT TCC 12 96 

Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
1210 1215 1220 

GAA AAT TCT TTA AGG CGT TTA GGA TTC TTC TCT AAA GTC AAA ATT GAA 1344 

Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys He Glu 
1225 1230 1235 

GAA AAA AGG GTT AAT AGC TCA CTC ATG GAT TTA TTA GTG AGC GTA GAA 13 92 

Glu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
1240 1245 1250 



GAG GGG CGT ACT GGG CAG TTG CAA TTT GGG TTA GGC TAT GGC TCT TAT 1440 
Glu Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
1255 1260 1265 



I_JA GGG CTT ATG CTT AAT GGG AGC GTG AGC GAA AGA AAC CTT TTT GGC 14 88 

£ly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
1270 1275 1280 1285 

ACA GGG CAA AGC ATG AGC TTG TAT GCT AAC ATC GCT ACA GGG GGG GGT 153 6 

Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn He Ala Thr Gly Gly Gly 
1290 1295 1300 

AGA TCT TAT CCG GGC ATG CCA AAA GGA GCG GGG CGT ATG TTT GCC GGG 15 84 

Ara Ser Tyr Pro Gly Met Pro Lys Gly Ala Gly Arg Met Phe Ala Gly 
1305 1310 1315 

AAT TTG AGC TTG ACT AAT CCA AGG ATT TTT GAC AGC TGG TAT AGC TCT 1632 
Asn Leu Ser Leu Thr Asn Pro Arg He Phe Asp Ser Trp Tyr Ser Ser 
1320 1325 1330 

ACG ATC AAC CTT TAT GCG GAT TAC AGG ATA AGC TAC CAA TAC ATC CAA 1680 
Thr He Asn Leu Tyr Ala Asp Tyr Arg He Ser Tyr Gin Tyr He Gin 
1335 1340 1345 



GGC GGG GGC TTT GGG GTG AAT GTC GGG CGC ATG CTG GGT AAT AGA 172 8 

n Gly Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arg 
50 1355 1360 1365 



ACC CAT GTG AGC TTA GGG TAT AAC TTG AAT GTT ACC AAA CTC CTT GGT 17 76 

Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
1370 1375 1380 

TTC AGC AGC CCT TTA TAC AAC CGC TAC TAT TCC TCT GTT AAT GAA GTG 1824 
Phe Ser Ser Pro Leu Tyr Asn Arg Tyr Tyr Ser Ser Val Asn Glu Val 
1385 1390 1395 

GTT TCT CCA AGG CAA TGT TCT ACC CCC GCA TCG GTG ATT ATC AAT CGC 1872 
Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val He He Asn Arg 
1400 1405 1410 

TTA TCA GGC GGT AAA ACC CCC TTA CAA CCT GAA AGC TGT TCT AGT CCT 192 0 

Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
1415 1420 1425 
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GGA GCG ATC ACC ACT TCA CCA GAA ATA AGA GGT ATT TGG GAT AGG GAT 1968 
Gly Ala lie Thr Thr Ser Pro Glu lie Arg Gly lie Trp Asp Arg Asp 
143 0 1435 1440 1445 

TAC CAT ACG CCT ATC ACC AGC TCT TTC ACC CTT GAT GTG AGC TAT GAC 2016 
Tyr His Thr Pro He Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
1450 1455 1460 

AAC ACC GAT GAT TAT TAC TTC CCT AGA AAT GGG GTT ATC TTT AGT TCC 2 0 64 

Asn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val He Phe Ser Ser 
1465 1470 1475 

TAT GCG ACG ATG TCT GGC TTG CCA AGC TCT GGC ACG CTC AAT TCT TGG 2112 
Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
1480 1485 1490 

AAC GGG TTA GGC GGG AAT GTC CGT AAC ACC AAA GTT TAT GGT AAA TTC 2160 
Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
1495 1500 1505 

GCC GCT TAC CAC CAT TTG CAA AAA TAT TTA TTG ATA GAT TTG ATC GCT 2208 
la Ala Tyr His His Leu Gin Lys Tyr Leu Leu He Asp Leu He Ala 
510 1515 1520 1525 

CGC TTT AAA ACG CAA GGA GGT TAT ATC TTT AGG TAT AAC ACC GAT GAT 2256 
Arg Phe Lys Thr Gin Gly Gly Tyr He Phe Arg Tyr Asn Thr Asp Asp 
1530 1535 1540 

TAC TTG CCC TTA AAC TCC ACC TTC TAC ATG GGG GGC GTA ACC ACG GTG 2304 
Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
1545 1550 1555 

AGA GGC TTT AGG AAC GGA TCG GTT ACT CCT AAA GAT GAG TTT GGC TTG 2352 
Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
1560 1565 1570 

TGG CTT GGA GGC GAT GGG ATT TTT ACC GCT TCT ACT GAA TTG AGC TAT 240 0 

Trp Leu Gly Gly Asp Gly He Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
1575 1580 1585 

GGG GTG CTA AAG GCG GCT AAA ATG CGC TTA GCG TGG TTT TTT GAC TTT 244 8 

Gly Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 
15 90 1595 1600 1605 

, T TTC TTA TAT AAC 24 96 

y Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 
1610 1615 1620 

GCT CCT GTT ACG ACA GCG AAT TTT AAA GAT TAT GGC GTT ATA GGG GCT 2544 
Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val He Gly Ala 
1625 1630 1635 

GGG TTT GAA AGA GCG ACT TGG AGG GCT TCC ACA GGC TTG CAG ATT GAA 2592 
Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin He Glu 
1640 1645 1650 

TGG ATT TCG CCC ATG GGG CCT TTG GTG TTG ATT TTC CCT ATA GCG TTT 2 64 0 

Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 
1655 1660 1665 

TTC AAC CAA TGG GGC GAT GGC AAT GGC AAG AAA TGT AAA GGG CTA TGC 2688 
Phe Asn Gin Trp Gly Asp Gly Asn Gly Lys Lys Cys Lys Gly Leu Cys 
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1670 1675 1680 1685 

TTC AAC CCT AAC ATG GAC GAT TAC ACG CAA CAC TTT GAA TTT TCT ATG 2 736 

Phe Asn Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
1690 1695 1700 

GGA ACA AGG TTT TAA 2 751 

Gly Thr Arg Phe * 
1705 

(2) ANGABEN ZU SEQ ID NO: 36: 

( i ) SEQUENZKENNZEICHEN: 

(A) LANGE: 917 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: 

le Lys Lys Leu lie Leu Ser Ser Leu Val Phe Ala Cys lie Asn Thr 
15 10 15 

Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
20 25 30 

Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
35 40 45 

Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
50 55 60 

Gin Thr Pro Lys Glu Met Lys Val Lys Ser lie Ser Tyr Val Gly Leu 
65 70 75 80 

Ser Tyr Met Ser Asp Met Leu Ala Asn Glu lie Val Lys lie Arg Val 
85 90 95 

Gly Asp lie Val Asp Ser Lys Lys lie Asp Thr Ala Val Leu Ala Leu 
100 105 110 
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Phe Asn Gin Gly Tyr Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
115 120 125 



e Leu Glu Phe His Phe Asp Glu Lys Ala Arg lie Ala Gly Val Glu 

130 135 140 

lie Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 

145 150 155 160 

Met Gly lie Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 

165 170 175 

Ala Lys Thr Ala Leu Lys Thr Ala Leu Glu Gly Gin Gly Tyr Tyr Gly 

180 185 190 

Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 

195 200 205 

lie Val Phe Asp Val Asn Arg Gly Asp Ser lie Tyr lie Lys Gin Ser 

210 215 220 
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lie Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met lie Glu Ser Leu 
225 230 235 240 

Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
245 250 255 

Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg lie 
260 265 270 

Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His lie Ser Ser 
275 280 285 

Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
290 295 300 

Lys Val Lys Glu Gly He Gin Tyr Arg He Ser Asp He Leu He Glu 
305 310 315 320 

He Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
325 330 335 

1 Lys Arg Lys Asp Val Phe Asn He Glu His Leu Arg Ala Asp Ala 
340 345 350 

Gin He Leu Lys Thr Glu He Ala Asp Lys Gly Tyr Ala Phe Ala Val 
355 360 365 

Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
370 375 380 

He Tyr Arg He Glu Val Gly Asp Met Val Tyr He Asn Asp Val He 
385 390 395 400 

He Ser Gly Asn Gin Arg Thr Ser Asp Arg He He Arg Arg Glu Leu 
405 410 415 

Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
420 425 430 

Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys He Glu 
435 440 445 

Glu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
450 455 460 

u Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
465 470 475 480 

Gly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
485 490 495 

Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn He Ala Thr Gly Gly Gly 
500 505 510 

Arg Ser Tyr Pro Gly Met Pro Lys Gly Ala Gly Arg Met Phe Ala Gly 
515 520 525 

Asn Leu Ser Leu Thr Asn Pro Arg He Phe Asp Ser Trp Tyr Ser Ser 
530 535 540 * 

Thr He Asn Leu Tyr Ala Asp Tyr Arg He Ser Tyr Gin Tyr He Gin 
54 5 550 555 560 
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Gin Gly Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arg 
565 570 575 

Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
580 585 590 

Phe Ser Ser Pro Leu Tyr Asn Arg Tyr Tyr Ser Ser Val Asn Glu Val 
595 600 605 

Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val lie lie Asn Arg 
610 615 620 

Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
625 630 635 640 

Gly Ala lie Thr Thr Ser Pro Glu He Arg Gly He Trp Asp Arg Asp 
645 650 655 

Tyr His Thr Pro He Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
660 665 670 

sn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val He Phe Ser Ser 
675 680 685 

Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
690 695 700 

Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
705 710 715 720 

Ala Ala Tyr His His Leu Gin Lys Tyr Leu Leu He Asp Leu He Ala 
725 730 735 

Arg Phe Lys Thr Gin Gly Gly Tyr He Phe Arg Tyr Asn Thr Asp Asp 
740 745 750 

Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
755 760 765 

Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
770 775 780 



Trp Leu Gly Gly Asp Gly He Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
to L 85 790 795 800 



y Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 
805 810 815 

Gly Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 
820 825 830 

Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val He Gly Ala 
835 840 845 

Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin He Glu 
850 855 860 

Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 
865 870 875 880 

Phe Asn Gin Trp Gly Asp Gly Asn Gly Lys Lys Cys Lys Gly Leu Cys 
885 890 895 



4 
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Phe Asn Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
900 905 910 

Gly Thr Arg Phe * 
915 

(2) ANGABEN ZU SEQ ID NO: 37: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 990 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 
<D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS130 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

ATG AAA AGA TTT GTT TTG TTT TTA TTG TTC ATG TGC GTT TGC GTT CAA 4 8 

Met Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
920 925 930 

GCT TAC GCC GAG CAA GAT TAC TTT TTT AGG GAT TTT AAA TCT AGA GAT 96 
Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 
935 940 945 

TTG CCC CAA AAA CTC CAT CTT GAT AAA AAG CTC TCC CAA ACA ATA CAG 144 
Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr lie Gin 
950 955 960 965 

CCA TGC ATG CAA CTT AAC GCA TCA AAA CAC TAC ACT TCT ACC GGG GTT 192 
Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val 
970 975 980 



AGA GAG CCT GAT AAA TGC ACA AAG AGT TTT AAA AAA TCC GCT CTC ATG 240 
g Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 
985 990 995 



TCC TAT GAC TTA GCG CTA GGT TAT TTG GTG AGT AAG AAT AAG CAA TAC 288 
Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 
1000 1005 1010 

GGC TTA AAG GCT ATA GAA ATT TTA AAC GCT TGG GCT AAA GAG CTT CAA 33 6 

Gly Leu Lys Ala lie Glu lie Leu Asn Ala Trp Ala Lys Glu Leu Gin 
1015 1020 1025 

AGC GTG GAT ACT TAT CAG AGC GAG GAT AAT ATC AAT TTT TAC ATG CCT 3 84 

Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn lie Asn Phe Tyr Met Pro 
1030 1035 1040 1045 

TAT ATG AAC ATG GCT TAT TGG TTT GTC AAA AAG GCG TTT CCT AGC CCA 432 
Tyr Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
1050 1055 1060 
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GAA TAT GAA GAT TTC ATT AAG CGG ATG CGC CAG TAT TCT CAA TCA GCT 480 
Glu Tyr Glu Asp Phe lie Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
1065 1070 1075 

CTT AAC ACT AAC CAT GGG GCG TGG GGC ATT CTT TTT GAT GTG AGT TCT 52 8 

Leu Asn Thr Asn His Gly Ala Trp Gly lie Leu Phe Asp Val Ser Ser 
1080 1085 1090 

GCG CTA GCG TTA GAC GAT AAT GCC CTT TTG CAC AAT AGC GCT AAT CGG 576 
Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Arg 
1095 1100 1105 

TGG CAG GAG TGG GTG TTT AAA GCC ATA GAT GAG AAT GGG GTT ATT GCT 624 
Trp Gin Glu Trp Val Phe Lys Ala lie Asp Glu Asn Gly Val lie Ala 
1110 1115 1120 1125 

AGC GCG ATC ACT AGG AGC GAT ACG AGC GAT TAT CAT GGC GGC CCT ACA 672 
Ser Ala lie Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
1130 1135 1140 



.G GGC ATT AAG GGG ATA GCT TAT ACC AAT TTC GCG CTT CTT GCG CTA 72 0 

ys Gly lie Lys Gly lie Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
1145 1150 1155 




ACC ATA TCA GGC GAA TTG CTT TTT GAG AAC GGG TAT GAT TTG TGG GGT 768 
Thr lie Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
1160 1165 1170 

AGT GGA GCT GGG AAA AGG CTC TCT GTG GCG TAT AAC AAA GTT GCA ACA 816 
Ser Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
1175 1180 1185 

TGG ATT TTA AAC CCT GAA ACT TTC CCT TAT TTC CAG CCT AAC CTT ATC 864 
Trp lie Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu lie 
H90 1195 1200 1205 

GGG GTG CAT AAC AAC GCC TAT TTC ATT ATT TTA GCC AAG CAT TAT TCT 912 
Gly Val His Asn Asn Ala Tyr Phe lie lie Leu Ala Lys His Tyr Ser 
1210 1215 1220 

AGC CCT AGT GCA AAT GAG CTT TTA AAG CAA GGC GAT TTA CAC GAA GAT 960 
Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
1225 1230 1235 

T TTC AGG CTG AAA CTC CGA TCG CCA TGA 990 
y Phe Arg Leu Lys Leu Arg Ser Pro * 
1240 1245 



(2) ANGABEN ZU SEQ ID NO: 38: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 330 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

<ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: 

Met Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
1 5 10 15 



58 

Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 
20 25 30 

Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr lie Gin 
35 40 45 

Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val 
50 55 60 

Arg Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 
65 70 75 80 

Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 
85 90 95 

Gly Leu Lys Ala lie Glu lie Leu Asn Ala Trp Ala Lys Glu Leu Gin 
100 105 110 



Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn He Asn Phe Tyr Met Pro 
115 120 125 



r Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
130 135 140 



Glu Tyr Glu Asp Phe He Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
145 150 155 160 

Leu Asn Thr Asn His Gly Ala Trp Gly He Leu Phe Asp Val Ser Ser 
165 170 175 

Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Arg 
180 185 190 

Trp Gin Glu Trp Val Phe Lys Ala He Asp Glu Asn Gly Val He Ala 
195 200 205 

Ser Ala He Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
210 215 220 

Lys Gly He Lys Gly He Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
225 230 235 240 

Thr He Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
245 250 255 

r Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
260 265 270 

Trp He Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu He 
27 5 280 285 

Gly Val His Asn Asn Ala Tyr Phe He He Leu Ala Lys His Tyr Ser 
2 $0 295 300 

Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
305 310 315 320 

Gly Phe Arg Leu Lys Leu Arg Ser Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 39: 
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( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1482 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS133 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1482 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 39: 

ATG CAA AGT CTT AGT TGG CTG AAT TTA GCG TTT CGT TGG CTC TTT ATA 4 8 

Met Gin Ser Leu Ser Trp Leu Asn Leu Ala Phe Arg Trp Leu Phe lie 
335 340 345 

CA GGG CTT GGC TAT TAT ATA ATG ACT TTA TTG CAA TGG TAT CAT TAC 96 
hr Gly Leu Gly Tyr Tyr lie Met Thr Leu Leu Gin Trp Tyr His Tyr 
350 355 360 

AGC GTG TTT AGG ATC TTA ACC AAG CAC CAC AAA ATG CGT TGG CAT GGG 144 
Ser Val Phe Arg lie Leu Thr Lys His His Lys Met Arg Trp His Gly 
365 370 375 

ATT TAT TTT TTA TTG CCT TTA GGG GTG TTT ATT CTG TCG TAT GCT TTC 192 
lie Tyr Phe Leu Leu Pro Leu Gly Val Phe lie Leu Ser Tyr Ala Phe 
380 385 390 

ACA ATG CCG TTT GTT TTT GAT TTC TTT TGC GGC GTT ATT CAA ATG CCC 240 
Thr Met Pro Phe Val Phe Asp Phe Phe Cys Gly Val lie Gin Met Pro 
395 400 405 410 

ATG CTC ATT GTT TGG GCC AAA CGC AAC GAC AAG CCT TTA GTT TTC ACG 2 88 

Met Leu lie Val Trp Ala Lys Arg Asn Asp Lys Pro Leu Val Phe Thr 
415 420 425 



CCA AGG GTG AAG CGC TTT TTT ATC TTC TTA TTA TTA TTT TTA ATC TTG 33 6 

o Arg Val Lys Arg Phe Phe lie Phe Leu Leu Leu Phe Leu lie Leu 
430 435 440 



CAT GAA ATC TTA AAT ATA GAA TTA GTC CCT TTG GAT GGG ATT TCG CTC 3 84 

His Glu lie Leu Asn lie Glu Leu Val Pro Leu Asp Gly lie Ser Leu 
445 450 455 

GCG CTA GGC TAT TTG TGT TTG TTT ATA TTC GTT TTA AGC GCT TCT TTA 432 
Ala Leu Gly Tyr Leu Cys Leu Phe lie Phe Val Leu Ser Ala Ser Leu 
460 465 470 

ATC TCT GAA AAA GCC TTA TCC AAG CAG TAT TTG CAA ACC GCT AAA GAT 4 80 

lie Ser Glu Lys Ala Leu Ser Lys Gin Tyr Leu Gin Thr Ala Lys Asp 
475 480 485 490 

AAA ATC ACC TCT TTA AAG AAT TTA AAA GTC ATC GCC ATT ACC GGA AGC 52 8 

Lys lie Thr Ser Leu Lys Asn Leu Lys Val lie Ala lie Thr Gly Ser 
495 500 505 



TTT GGG AAA ACC AGC ACC AAA AAT TTC TTG CTT CAA ATC TTA CAA ACC 
Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin He Leu Gin Thr 
510 515 520 

ACA TTC AAC GCG CAT GCA AGC CCC AAA AGC GTC AAT ACC CTT TTA GGG 
Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
525 530 535 

CTT GCG AAT GAT ATT AAT CAG AAT TTA GAC GAT AGG AGT GAA ATC TAT 
Leu Ala Asn Asp He Asn Gin Asn Leu Asp Asp Arg Ser Glu He Tyr 
540 545 550 

ATC GCT GAA GCC GGG GCA AGG AAT AAG GGC GAT ATT AAA GAA ATC ACC 
He Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp He Lys Glu He Thr 
555 560 565 570 

TGT CTC ATT GAA CCG CAC CTT GTT GTG GTT GCA GAA GTG GGC GAA CAG 
Cys Leu He Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
575 580 585 
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£AT TTA GAA TAC TTT AAA ACT TTA GAA AAT ATT TGC GAG ACT AAA GCG 
' s Leu Glu Tyr Phe Lys Thr Leu Glu Asn He Cys Glu Thr Lys Ala 
590 595 600 



GAA TTA TTG GAT TCC AAA CGC TTA GAA AAA GCC TTT TGT TAC TCG GTG 
Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
605 610 615 

GAA AAG ATC AAG CCC TAT GCC CCT AAA GAT AGC CCT TTA ATA GAC TAT 
Glu Lys He Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu He Asp Tyr 
620 625 630 

TCT AGC CTG GTT AAA AAC ATC CAA TCC ACT TTA AAA GGC ACT TCT TTT 
Ser Ser Leu Val Lys Asn He Gin Ser Thr Leu Lys Gly Thr Ser Phe 
635 640 645 650 

GAA ATG CTT ATA GGT AGC GTT TGG GAA AGA TTT GAA ACA AAG GTT CTA 
Glu Met Leu He Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
655 660 665 

GGG GAG TTT AGC GCT TAT AAT ATC GCT TCA GCC ATT TTA ATC GCT AAG 
Gly Glu Phe Ser Ala Tyr Asn He Ala Ser Ala He Leu He Ala Lys 
670 675 680 

T TTA GGC TTA GAG ACC GAA AGG ATC AAA CGG CTT GTT TTA GAA CTC 
s Leu Gly Leu Glu Thr Glu Arg He Lys Arg Leu Val Leu Glu Leu 
685 690 695 

AAC CCT ATT GCT CAT CGT TTG CAA CTT TTG GAA GTG AAT CAA AAA ATC 
Asn Pro He Ala His Arg Leu Gin Leu Leu Glu Val Asn Gin Lys He 
700 705 710 

ATC ATA GAC GAT AGC TTT AAT GGG AAT TTA AAG GGC ATG TTA GAG GGC 
He He Asp Asp Ser Phe Asn Gly Asn Leu Lys Gly Met Leu Glu Gly 
715 720 725 730 

ATT CGT TTA GCG AGT TTG CAC AAA GGG CGT AAA GTC ATT GTA ACA CCG 
He Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
735 740 745 



GGC TTA GTG GAA AGC AAT ACA GAA AGT AAT GAG GCT TTA GCG CAA AAA 
Gly Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 



61 

750 755 760 

ATA GAC GGG GTT TTT GAT GTC GCT ATC ATC ACA GGG GAG TTG AAT TCC 1344 
He Asp Gly Val Phe Asp Val Ala He He Thr Gly Glu Leu Asn Ser 
765 770 775 

AAA ACG ATT GCT TCA CAA TTG AAA ACC CCC CAA AAA ATC TTA CTC AAG 13 92 

Lys Thr He Ala Ser Gin Leu Lys Thr Pro Gin Lys He Leu Leu Lys 
780 785 790 

GAT AAG GCG CAA TTG GAA AAT ATC TTA CAA GCC ACC ACG ATT CAA GGC 144 0 

Asp Lys Ala Gin Leu Glu Asn He Leu Gin Ala Thr Thr He Gin Gly 
79 5 800 805 810 

GAT TTG ATT TTA TTC GCT AAT GAC GCC CCT AAT TAC ATT TAG 14 82 

Asp Leu He Leu Phe Ala Asn Asp Ala Pro Asn Tyr He * 
815 820 

(2) ANGABEN ZU SEQ ID NO: 40: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 4 94 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 40: 

Met Gin Ser Leu Ser Trp Leu Asn Leu Ala Phe Arg Trp Leu Phe He 
1 5 10 15 

Thr Gly Leu Gly Tyr Tyr He Met Thr Leu Leu Gin Trp Tyr His Tyr 
20 25 30 

Ser Val Phe Arg He Leu Thr Lys His His Lys Met Arg Trp His Gly 
35 40 45 

He Tyr Phe Leu Leu Pro Leu Gly Val Phe He Leu Ser Tyr Ala Phe 
50 55 60 

Thr Met Pro Phe Val Phe Asp Phe Phe Cys Gly Val He Gin Met Pro 
65 70 75 80 

t Leu He Val Trp Ala Lys Arg Asn Asp Lys Pro Leu Val Phe Thr 
85 90 95 

Pro Arg Val Lys Arg Phe Phe He Phe Leu Leu Leu Phe Leu He Leu 
100 105 110 

His Glu He Leu Asn He Glu Leu Val Pro Leu Asp Gly He Ser Leu 
115 120 125 

Ala Leu Gly Tyr Leu Cys Leu Phe He Phe Val Leu Ser Ala Ser Leu 
130 135 140 

He Ser Glu Lys Ala Leu Ser Lys Gin Tyr Leu Gin Thr Ala Lys Asp 
145 150 155 160 

Lys He Thr Ser Leu Lys Asn Leu Lys Val He Ala He Thr Gly Ser 
165 170 175 
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Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin lie Leu Gin Thr 
180 185 190 

Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
195 200 205 

Leu Ala Asn Asp lie Asn Gin Asn Leu Asp Asp Arg Ser Glu He Tvr 
210 215 2 
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lie Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp He Lys Glu He Thr 
225 230 235 240 

Cys Leu He Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
245 2S0 255 

His Leu Glu Tyr Phe Lys Thr Leu Glu Asn He Cys Glu Thr Lys Ala 
260 265 270 

Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
275 280 285 

Lu Lys He Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu He Asp Tyr 
290 295 300 

Ser Ser Leu Val Lys Asn He Gin Ser Thr Leu Lys Gly Thr Ser Phe 
U:s 310 315 320 

Glu Met Leu He Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
325 330 335 

Gly Glu Phe Ser Ala Tyr Asn He Ala Ser Ala He Leu He Ala Lys 
340 345 350 

His Leu Gly Leu Glu Thr Glu Arg He Lys Arg Leu Val Leu Glu Leu 
355 3 60 365 

ASn ?™ Ile Ala His ^ Leu Gln Leu Leu Glu Va l Asn Gin Lys He 
370 375 380 



385 Ile Asp Asp Ser phe Asn Gly Asn Leu Lys Gly Met Leu Glu G1 y 



385 39 ° " 3*95 400 



He Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
^ 405 410 415 

y Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 
420 425 430 

He Asp Gly Val Phe Asp Val Ala Ile He Thr Gly Glu Leu Asn Ser 

440 445 

Lys Thr He Ala Ser Gin Leu Lys Thr Pro Gin Lys He Leu Leu Lys 

455 460 

Asp Lys Ala Gin Leu Glu Asn Ile Leu Gin Ala Thr Thr lie Gin Gly 
465 470 475 480 

Asp Leu He Leu Phe Ala Asn Asp Ala Pro Asn Tyr lie * 
485 490 

(2) ANGABEN ZU SEQ ID NO: 41: 
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( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 600 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 




(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPC134 

(ix) MERKMAL: 

(A) NAME / SCHLUSSEL : CDS 

(B) LAGE : 1 . .600 

(xi) SEQXJENZBESCHREIBUNG: SEQ ID NO: 41: 

ATG TCA AGC GCT CTG TTA GGC TTA CAA ATT GTT TTA GCG GTA TTG ATT 4 8 

Met Ser Ser Ala Leu Leu Gly Leu Gin lie Val Leu Ala Val Leu lie 
* 95 500 505 510 

r 'G GTG GTG GTT TTG TTG CAA AAA AGT TCT AGC ATC GGC TTA GGG ACT 96 
f al Val Val Val Leu Leu Gin Lys Ser Ser Ser lie Gly Leu Gly Thr 
515 520 525 

TAT AGC GGG AGT AAT GAG TCT TTA TTT GGC GCT AAA GGG CCC GCG TGC 144 
Tyr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
530 535 540 

TTT ATG GCG AAA TTG ACC ATG TTT TTA GGG CTG TTA TTT GTT ATC AAC 192 
Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val He Asn 
545 550 555 

ACC ATC GCT TTG GGC TAT TTT TAC AAC AAA GAA TAC GGC AAA AGC ATT 24 0 

Thr lie Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser He 
560 565 570 

TTA GAT GAA ACT AAA ACC AAC AAA GAG CTT TCG CCC TTA GTC CCT GCC 2 88 

Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
575 580 585 590 

ACC GGC ACG CTC AAC CCT ACA CTC AAT CCC ACG CTC AAC CCT ACG CTC 3 36 

hr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu 
595 600 605 

c CCT TTA qAg caa gcc CAA ACG 3 84 

Asn Pro Leu Glu Gin Ala Pro Thr Asn Pro Leu Met Pro Lys Gin Thr 
610 615 620 

CCT AAC GAA CTC CCT AAA GAG CCA GCC AAA GCG CCT TCT GTT GAA AGC 432 
Pro Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
^25 630 635 

CCC AAA CAG AAT GAA AAA AAT GAA AAA AAT GAC GCC AAA GAG AAT GGT 480 
Pro Lys Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu Asn Gly 
640 645 650 

ATA AAG GGT GTT GAA AAA ACT AAA GAG AAC GCC AAA ACG CCC CCA ACC 52 8 

He Lys Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
655 660 665 670 
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ACC CAC CAA AAG CCT AAA ACG CAT GCG ACA CAA ACC AAC GCC CAT ACC 576 
Thr His Gin Lys Pro Lys Thr His Ala Thr Gin Thr Asn Ala His Thr 
675 680 685 



AAC CAA AAA AAG GAT GAA AAA TAA 
Asn Gin Lys Lys Asp Glu Lys * 
690 

(2) ANGABEN ZU SEQ ID NO: 42: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 200 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 42: 

Met Ser Ser Ala Leu Leu Gly Leu Gin lie Val Leu Ala Val Leu He 
1 5 10 15 

al Val Val Val Leu Leu Gin Lys Ser Ser Ser He Gly Leu Gly Thr 
20 25 30 

Tyr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
35 40 45 

Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val He Asn 
50 55 60 

Thr He Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser He 
65 70 75 80 

Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
85 90 95 

Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu 
100 105 110 

Asn Pro Leu Glu Gin Ala Pro Thr Asn Pro Leu Met Pro Lys Gin Thr 
115 120 125 

o Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
130 135 140 

ro Lys Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu Asn Gly 
145 150 155 160 

He Lys Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
165 170 175 

Thr His Gin Lys Pro Lys Thr His Ala Thr Gin Thr Asn Ala His Thr 
180 185 190 

Asn Gin Lys Lys Asp Glu Lys * 
195 200 

(2) ANGABEN ZU SEQ ID NO: 43: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1536 Basenpaare 



600 
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(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TT E LB ARE HERKUNFT: 
(B) CLON(E) : HPS143 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE : 1 . .1536 




(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 43: 

ATG AAA AAA CTT CTT TAT ACC ATA CTC GCG CTT CTT TTA ATC GGC CTT 48 
Met Lys Lys Leu Leu Tyr Thr lie Leu Ala Leu Leu Leu lie Gly Leu 
205 210 215 

J*TA ACA ATC TAT CTC ATC CTT TTT ACA GAA TGG GGG AAT AAG ATC ATC 96 
eu Thr lie Tyr Leu lie Leu Phe Thr Glu Trp Gly Asn Lys lie lie 
220 225 230 

GCT TCG TAT ATA GAG AAA AAA ATC AAC CCG AAC GAG CAC TAC TTG AGC 144 
Ala Ser Tyr lie Glu Lys Lys lie Asn Pro Asn Glu His Tyr Leu Ser 
235 240 245 

GTT AAA ACC TTT AAA TTG AGA TTC AAC TCT TTG GAT TTT AAA GCT CAA 192 
Val Lys Thr Phe Lys Leu Arg Phe Asn Ser Leu Asp Phe Lys Ala Gin 
250 255 260 

GCC AAC GAT GAT TCC ACG CTC ATT CTT AAG GGG GAT TTT TCA CTT TTA 240 
Ala Asn Asp Asp Ser Thr Leu lie Leu Lys Gly Asp Phe Ser Leu Leu 
265 270 275 280 

AAG CAA AGC GTA AAT TTG AAT TAC CAT ATA GAT ATT AAA GAT TTA CGC 288 
Lys Gin Ser Val Asn Leu Asn Tyr His He Asp He Lys Asp Leu Arg 
285 290 295 

TCT TTC AAA GAA TGG ATA CCC TAC CCT TTA AGG GGG GCT GTT ATC ACT 336 
Ser Phe Lys Glu Trp He Pro Tyr Pro Leu Arg Gly Ala Val He Thr 
300 305 310 



T GGG AAT ATT AAA GGG CAT AGA AAA GCC CTT ATG ATT CAA GGC GTC 3 84 

fer Gly Asn He Lys Gly His Arg Lys Ala Leu Met He Gin Gly Val 
315 320 325 

TCT AAT GTG GCT CAA TCC CAC ACT GCC TAC AAT GCC CTT TTA GAT GAT 43 2 

Ser Asn Val Ala Gin Ser His Thr Ala Tyr Asn Ala Leu Leu Asp Asp 
330 335 340 

TTC AAG CTT TCT CGC TTA AAT TTG AAC GCA CAA GAC GCC AAT TTA GAA 48 0 

Phe Lys Leu Ser Arg Leu Asn Leu Asn Ala Gin Asp Ala Asn Leu Glu 
345 350 355 360 

GAT TTG CTT TAT TTA ATC AAT CGC CCC GCT TAT GCG AAC GCA AAA GTG 52 8 

Asp Leu Leu Tyr Leu lie Asn Arg Pro Ala Tyr Ala Asn Ala Lys Val 
365 370 375 

TCC TTA CAG GCG GAT TTT AAC TCT CTA AAG CCT TTA GAG GGG CAT TTG 576 
Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys Pro Leu Glu Gly His Leu 
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^^^^ys 



380 385 390 

ATC CTA ACA GCT AAT AAC GCT TTA ATC AAT AAC GCC CTA ATC AAT CAA 624 
lie Leu Thr Ala Asn Asn Ala Leu lie Asn Asn Ala Leu lie Asn Gin 
395 400 405 

ATT TTT CAT ACG CTT GTT TTC AGC CTC TCG CAT 672 

lie Phe His Leu Asn Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
410 415 420 

TCA AGC GAC TTT AAA GGA AAC AAA GCC ATC AGC GAT ACC ACC CTG ACT 72 0 

Ser Ser Asp Phe Lys Gly Asn Lys Ala lie Ser Asp Thr Thr Leu Thr 
425 430 435 440 

AGC CCT TTA GCC AAT TTC AAA GCC CTA AAA AGC GAA TAC CTT TTC TCT 7 68 

Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
445 450 455 

ATT TTA AAA CTC AAC GCC CCC TAC ACT TTA GAA ATC CCC AAT CTA GCC 816 
lie Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu lie Pro Asn Leu Ala 
460 465 470 




CTC TAT AAC ATT ACC AAC CAC CCC TTA AAA GGG AGC TTG ACT TTA 8 64 

ys Leu Tyr Asn lie Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
475 480 485 

AAA GGC GCT ATA GAA CAA AGC CCC AAA CTT TTA AAA GTC AGC GGC CAT 912 
Lys Gly Ala lie Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
490 495 500 

TCA AAT TTA CTA GAC GGC GCG CTG GAT TTC ACG CTT TTA AAT AAA GAT 960 
Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
505 510 515 520 

TTG AAA GGG CGT TTT TCC AAT ATT TCC ACT TTA AAA GCT TTA GAT TTA 1008 
Leu Lys Gly Arg Phe Ser Asn lie Ser Thr Leu Lys Ala Leu Asp Leu 
525 530 535 

TTC CAT TAC CCT AAG TTT TTC CAA TCC GTT GCA GAC GCT AAT TTG GAT 1056 
Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
540 545 550 

TAT GAT CTT ATC GCT AAG CAA GGC GTA TTG AAA GCC CGC CTA AAA AAC 1104 
r Asp Leu lie Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
555 560 565 

'GCA AGA TTC CTC AAA AAT GCA TTC AGC GAT TTT CTC TAC TCC ATT TCT 1152 
Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser lie Ser 
570 575 580 

AAA TTT GAT ATT ACA AAA GAA ATT TAT AAC GAT GCC AAT CTG GTA AGC 1200 
Lys Phe Asp lie Thr Lys Glu lie Tyr Asn Asp Ala Asn Leu Val Ser 
585 590 595 600 

CAA ATC AAC CAG CAA CGC CTG CTC TCT GAT CTG AGT TTA AAA AGC CCC 124 8 

Gin lie Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
605 610 615 

AAA ACC CAA TTG AAA ATC CAT AAC GGT TTG TTG GAT TTA AAC ACC AAA 1296 
Lys Thr Gin Leu Lys lie His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
620 625 630 
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CAA ATG AAC ATG CTC ATG GAT GCG GAA ATT TTA AAA TTC ATT TTT AAA 1344 
Gin Met Asn Met Leu Met Asp Ala Glu lie Leu Lys Phe lie Phe Lys 
635 640 645 

ATG AAA CTT CAA GGC AAC ATG CAC CAG CCA AAA TTT TCT CTC ATT TTA 1392 
Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu lie Leu 
650 655 660 

AAC GAA AAA GCC ATT CAG CAA AAC TTG CAA CAA GGC TTG AAA GAA ATC 1440 
Asn Glu Lys Ala lie Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu lie 
665 670 675 680 

TTA AAA AAC GAC ACC CTT AAA AAA GGT TTA GAT CAT TTG CTT AAA GAT 14 88 

Leu Lys Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
685 690 695 

GAT AAG CTC AAA GAA AAG CTT GAA AAA GGG CTT AAG GGG CTT TTT TAA 1536 
Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe * 
700 705 710 

I) ANGABEN ZU SEQ ID NO: 44: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 512 Aminosauren 

( B ) ART : Ami no s aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 

Met Lys Lys Leu Leu Tyr Thr lie Leu Ala Leu Leu Leu lie Gly Leu 
15 10 15 

Leu Thr lie Tyr Leu lie Leu Phe Thr Glu Trp Gly Asn Lys lie lie 
20 25 30 

Ala Ser Tyr lie Glu Lys Lys lie Asn Pro Asn Glu His Tyr Leu Ser 
35 40 45 

Val Lys Thr Phe Lys Leu Arg Phe Asn Ser Leu Asp Phe Lys Ala Gin 
50 55 60 

a Asn Asp Asp Ser Thr Leu lie Leu Lys Gly Asp Phe Ser Leu Leu 
5 70 75 80 

Lys Gin Ser Val Asn Leu Asn Tyr His lie Asp lie Lys Asp Leu Arg 
85 90 95 

Ser Phe Lys Glu Trp lie Pro Tyr Pro Leu Arg Gly Ala Val lie Thr 
100 105 110 

Ser Gly Asn lie Lys Gly His Arg Lys Ala Leu Met lie Gin Gly Val 
115 120 125 

Ser Asn Val Ala Gin Ser His Thr Ala Tyr Asn Ala Leu Leu Asp Asp 
130 135 140 

Phe Lys Leu Ser Arg Leu Asn Leu Asn Ala Gin Asp Ala Asn Leu Glu 
145 150 155 160 

Asp Leu Leu Tyr Leu lie Asn Arg Pro Ala Tyr Ala Asn Ala Lys Val 
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165 170 175 

Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys Pro Leu Glu Gly His Leu 
180 185 190 

lie Leu Thr Ala Asn Asn Ala Leu lie Asn Asn Ala Leu lie Asn Gin 
195 200 205 

He Phe His Leu Asn Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
210 215 220 

Ser Ser Asp Phe Lys Gly Asn Lys Ala lie Ser Asp Thr Thr Leu Thr 
225 230 235 240 

Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
245 250 255 

He Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu He Pro Asn Leu Ala 
260 265 270 

ys Leu Tyr Asn He Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
275 280 285 

ys Gly Ala He Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
290 295 300 

Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
305 310 315 320 

Leu Lys Gly Arg Phe Ser Asn He Ser Thr Leu Lys Ala Leu Asp Leu 
325 330 335 

Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
340 345 350 

Tyr Asp Leu He Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
355 360 365 

Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser He Ser 
370 375 380 

Lys Phe Asp He Thr Lys Glu He Tyr Asn Asp Ala Asn Leu Val Ser 
385 390 395 400 

tn He Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
405 410 415 

Lys Thr Gin Leu Lys He His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
420 425 430 

Gin Met Asn Met Leu Met Asp Ala Glu He Leu Lys Phe He Phe Lys 
435 440 445 

Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu He Leu 
450 455 460 

Asn Glu Lys Ala He Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu He 
4 65 470 475 480 

Leu Lys Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
485 490 495 
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Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe 
500 505 510 

(2) ANGABEN ZU SEQ ID NO: 45: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 540 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS144 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..540 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 45: 

ATG AAG AGA TCT TCT GTA TTT AGT TTC TTG GTA GCT TTT TTA TTG GTA 4 8 

Met Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
515 520 525 

GCT GGC TGT AGT CAT AAA ATG GAT AAT AAG ACT GTG GCC GGC GAT GTG 96 
Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
530 535 540 

AGT GCT AAA ACG GTT CAG ACT GCA CCT GTT ACT ACA GAA CCA GCT CCA 144 
Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
545 550 555 560 

GAG AAA GAA GAG CCT AAA CAA GAG CCA GCT CCA GTG GTT GAA GAA AAA 192 
Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
565 570 575 

CCG GCT GTT GAG AGC GGG ACT ATC ATC GCT TCT ATT TAT TTT GAT TTT 24 0 

Pro Ala Val Glu Ser Gly Thr lie lie Ala Ser lie Tyr Phe Asp Phe 
580 585 590 

X2 AAG TAT GAA ATC AAA GAA TCC GAT CAA GAG ACT TTA GAT GAG ATC 288 
p Lys Tyr Glu lie Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu lie 
595 600 605 

GTG CAA AAA GCT AAA GAA AAC CAC ATG CAA GTG CTT TTG GAA GGC AAT 336 
Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
610 615 620 

ACC GAT GAA TTT GGC TCT AGC GAA TAC AAC CAA GCG CTT GGC GTT AAA 3 84 

Thr Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
625 630 635 640 

AGG ACT TTG AGC GTG AAA AAC GCT TTA GTC ATT AAA GGG GTA GAA AAA 4 32 

Arg Thr Leu Ser Val Lys Asn Ala Leu Val He Lys Gly Val Glu Lys 
645 650 655 

GAT ATG ATC AAA ACC ATC AGT TTT GGT GAA ACC AAA CCC AAA TGC GCC 4 80 

Asp Met He Lys Thr He Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 
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660 665 670 

CAA AAA ACT AGA GAG TGT TAT AAA GAA AAC AGA AGA GTG GAT GTC AAA 52 8 

Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
675 680 685 

TTA ATG AAG TAA 540 
Leu Met Lys * 
690 



(2) ANGABEN ZU SEQ ID NO: 46: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 180 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 46 



>t Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
1 5 10 15 

Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
20 25 30 

Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
35 40 45 

Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
50 55 .60 

Pro Ala Val Glu Ser Gly Thr lie lie Ala Ser lie Tyr Phe Asp Phe 
65 70 75 80 

Asp Lys Tyr Glu He Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu He 
85 90 95 

Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
100 105 110 

Thr Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
115 120 125 

g Thr Leu Ser Val Lys Asn Ala Leu Val He Lys Gly Val Glu Lys 
130 135 140 

Asp Met He Lys Thr He Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 
145 150 155 160 

Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
165 170 175 

Leu Met Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 47: 

(i) S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 155 7 Basenpaare 

(B) ART: Nucleotid 
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(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LBARE HERKUNFT: 

(B) CLON(E) : HPC140, HPC150, HPC179 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1557 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 47: 

ATG ATA AAA AAG AAT AGA ACG CTG TTT CTT AGT CTA GCC CTT TGC GCT 48 
Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys Ala 
185 190 195 



AGC ATA AGT TAT GCC GAA GAT GAT GGA GGG TTT TTC ACC GTC GGT TAT 96 
"er lie Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly Tyr 
200 205 210 



AG CTC GGG CAA GTC ATG CAA GAT GTC CAA AAC CCA GGC GGC GCT AAA 144 
Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala Lys 
215 220 225 

AGC GAC GAA CTC GCC AGA GAG CTT AAC GCT GAT GTA ACG AAC AAC ATT 192 
Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn lie 
230 235 240 

TTA AAC AAC AAC ACC GGA GGC AAC ATC GCA GGG GCG TTG AGT AAC GCT 24 0 

Leu Asn Asn Asn Thr Gly Gly Asn lie Ala Gly Ala Leu Ser Asn Ala 
245 250 255 260 

TTC TCC CAA TAC CTT TAT TCG CTT TTA GGG GCT TAC CCC ACA AAA CTC 288 
Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys Leu 
265 270 275 

AAT GGT AGC GAT GTG TCT GCG AAC GCT CTT TTA AGT GGT GCG GTA GGC 336 
Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val Gly 
280 285 290 

T GGG ACT TGT GCG GCT GCA GGG ACG GCT GGT GGC ACT TCT CTT AAC 3 84 

r Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu Asn 
295 300 305 

ACT CAA AGC ACT TGC ACC GTT GCG GGC TAT TAC TGG CTC CCT AGC TTG 432 
Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser Leu 
310 315 320 

ACT GAC AGG ATT TTA AGC ACG ATC GGC AGC CAG ACT AAC TAC GGC ACG 4 80 

Thr Asp Arg lie Leu Ser Thr lie Gly Ser Gin Thr Asn Tyr Gly Thr 
325 330 335 340 

AAC ACC AAT TTC CCC AAC ATG CAA CAA CAG CTC ACC TAC TTG AAT GCG 528 
Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn Ala 
345 350 355 

GGG AAT GTG TTT TTT AAT GCG ATG AAT AAG GCT TTA GAG AAT AAG AAT 576 
Gly Asn Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys Asn 
360 365 370 
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GGA ACT AGT AGT GCT AGT GGA ACT AGT GGT GCG ACT GGT TCA GAT GGT 624 
Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp Gly 
375 380 385 

CAA ACT TAC TCC ACA CAA GCT ATC CAA TAC CTT CAA GGC CAA CAA AAT 672 
Gin Thr Tyr Ser Thr Gin Ala lie Gin Tyr Leu Gin Gly Gin Gin Asn 
390 395 400 

ATC TTA AAT AAC GCA GCG AAC TTG CTC AAG CAA GAT GAA TTG CTC TTA 720 
lie Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu Leu 
405 410 415 420 

GAA GCT TTC AAC TCT GCC GTA GCC GCC AAC ATT GGG AAT AAG GAA TTC 7 68 

Glu Ala Phe Asn Ser Ala Val Ala Ala Asn lie Gly Asn Lys Glu Phe 
425 430 435 

AAT TCA GCC GCT TTT ACA GGT TTG GTG CAA GGC ATT ATT GAT CAA TCT 816 
Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly lie lie Asp Gin Ser 
440 445 450 



£AA GCG GTT TAT AAC GAG CTC ACT AAA AAC ACC ATT AGC GGG AGT GCG 864 
*n Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr lie Ser Gly Ser Ala 
455 460 465 



GTT ATT AGC GCT GGG ATA AAC TCC AAC CAA GCT AAC GCT GTG CAA GGG 912 
Val lie Ser Ala Gly lie Asn Ser Asn Gin Ala Asn Ala Val Gin Gly 
470 475 480 

CGC GCT AGT CAG CTC CCT AAC GCT CTT TAT AAC GCG CAA GTA ACT TTG 960 
Arg Ala Ser. Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr Leu 
485 490 495 500 

GAT AAA ATC AAT GCG CTC AAT AAT CAA GTG AGA AGC ATG CCT TAC TTG 10 08 

Asp Lys lie Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr Leu 
505 510 515 

CCC CAA TTC AGA GCC GGG AAC AGC CGT TCA ACG AAT ATT TTA AAC GGG 1056 
Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn lie Leu Asn Gly 
520 525 530 

TTT TAC ACC AAA ATA GGC TAT AAG CAA TTC TTC GGG AAG AAA AGG AAT 1104 
Phe Tyr Thr Lys lie Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg Asn 
535 540 545 

C GGT TTG CGC TAT TAT GGT TTC TTT TCT TAT AAC GGA GCG AGC GTG 1152 
e Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser Val 
550 555 560 

GGC TTT AGA TCC ACT CAA AAT AAT GTA GGG TTA TAC ACT TAT GGG GTG 120 0 

Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly Val 
565 570 575 580 

GGG ACT GAT GTG TTG TAT AAC ATC TTT AGC CGC TCC TAT CAA AAC CGC 124 8 

Gly Thr Asp Val Leu Tyr Asn lie Phe Ser Arg Ser Tyr Gin Asn Arg 
585 590 595 

TCT GTG GAT ATG GGC TTT TTT AGC GGT ATC CAA TTA GCC GGT GAG ACC 1296 
Ser Val Asp Met Gly Phe Phe Ser Gly lie Gin Leu Ala Gly Glu Thr 
600 605 610 

TTC CAA TCC ACG CTC AGA GAT GAC CCC AAT GTG AAA TTG CAT GGG AAA 1344 
Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly Lys 



615 



620 



625 





ATC AAT AAC ACG CAC TTC CAG TTC CTC TTT GAC TTC GGT ATG AGG ATG 
lie Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg Met 
630 635 640 

AAC TTC GGT AAG TTG GAC GGG AAA TCC AAC CGC CAC AAC CAG CAC ACG 
Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His Thr 
64 5 650 655 660 

GTG GAA TTT GGC GTA GTG GTG CCT ACG ATT TAT AAC ACT TAT TAC AAA 
Val Glu Phe Gly Val Val Val Pro Thr lie Tyr Asn Thr Tyr Tyr Lys 
665 670 675 

TCA GCA GGG ACT ACC GTG AAG TAT TTC CGT CCT TAT AGC GTT TAT TGG 
Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr Trp 
680 685 690 

TCT TAT GGG TAT TCA TTC TAA 
Ser Tyr Gly Tyr Ser Phe * 
695 

2) ANGABEN ZU SEQ ID NO: 48: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 519 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 48: 

Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys Ala 
1 5 10 15 

Ser lie Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly Tyr 
20 25 30 

Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala Lys 
35 40 45 

Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn lie 
50 55 60 

u Asn Asn Asn Thr Gly Gly Asn lie Ala Gly Ala Leu Ser Asn Ala 
65 70 75 80 

Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys Leu 
85 90 95 

Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val Gly 
100 105 110 

Ser Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu Asn 
115 120 125 

Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser Leu 
130 135 140 

Thr Asp Arg lie Leu Ser Thr lie Gly Ser Gin Thr Asn Tyr Gly Thr 
145 150 155 160 
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Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn Ala 
165 170 175 

Gly Asn Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys Asn 
180 185 190 

Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp Gly 
195 200 205 

Gin Thr Tyr Ser Thr Gin Ala lie Gin Tyr Leu Gin Gly Gin Gin Asn 
210 215 220 

lie Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu Leu 
225 230 235 240 

Glu Ala Phe Asn Ser Ala Val Ala Ala Asn lie Gly Asn Lys Glu Phe 
245 250 255 

Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly lie lie Asp Gin Ser 
260 265 270 

.n Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr He Ser Gly Ser Ala 
275 280 285 

Val lie Ser Ala Gly He Asn Ser Asn Gin Ala Asn Ala Val Gin Gly 
290 295 300 

Arg Ala Ser Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr Leu 
305 310 315 320 

Asp Lys He Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr Leu 
325 330 335 

Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn He Leu Asn Gly 
340 _ 345 350 

Phe Tyr Thr Lys He Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg Asn 
355 360 365 

He Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser Val 
370 375 380 

Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly Val 
"5 390 395 400 

y Thr Asp Val Leu Tyr Asn He Phe Ser Arg Ser Tyr Gin Asn Arg 
405 410 415 

Ser Val Asp Met Gly Phe Phe Ser Gly He Gin Leu Ala Gly Glu Thr 
420 425 430 

Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly Lys 
435 440 445 

He Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg Met 
450 455 460 

Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His Thr 
465 470 475 480 

Val Glu Phe Gly Val Val Val Pro Thr He Tyr Asn Thr Tyr Tyr Lys 
485 490 495 
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Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr Trp 
500 505 510 

Ser Tyr Gly Tyr Ser Phe * 
515 

(2) ANGABEN ZU SEQ ID NO: 49: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 1062 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS152 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1062 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 49: 

TTG AAA CAT TTA ACC CCA CTC ACT CAC ACC ATC TTT AAA GCC TTA TGG 4 8 

Leu Lys His Leu Thr Pro Leu Thr His Thr lie Phe Lys Ala Leu Trp 
520 525 530 535 

CTA GGC ACA GCC TTA AGT GCA TCT TTA AGT TTA GCC GCA ACA GAA AGC 96 
Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
540 545 550 

CCC ACT AAA ACA GAG CCT AAG CCC GCT AAA GGG GTT AAA AAC AAG CCC 144 
Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys Asn Lys Pro 
555 560 565 

AAA TCG CCC GTT ACT AAA GTC ATG ATG ACC AAT TGC GAC AAT ATT AAA 192 
Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn He Lys 
570 575 580 



^(gc 



GAT TTT AAC GCT AAG CAA AAA GAA GTC TTA AAA GCC GCT TAT CAA TTC 24 0 

p Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
585 590 595 



C TCT AAA GAA AAT TTA GGC TAT GAA ATG GCA GGC ATT GCA TGG AAA 2 88 

Gly Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly He Ala Trp Lys 
600 605 610 615 

GAG TCA TGC GCA GGG GTT TAT AAA ATC AAT TTT TCG GAT CCG AGC GCG 336 
Glu Ser Cys Ala Gly Val Tyr Lys He Asn Phe Ser Asp Pro Ser Ala 
620 625 630 

GGC GTG TAT CAT TCT TAT ATC CCA AGC GTT CTA AAA AGC TAT GGG CAT 3 84 

Gly Val Tyr His Ser Tyr He Pro Ser Val Leu Lys Ser Tyr Gly His 
635 640 645 

AAT GAT AGC CCC TTT TTG CGT AAT GTG ATG GGG GAA TTG CTC ATT AAA 432 
Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu He Lys 
650 655 660 



• 
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GAC GAT GCG TTT GCT TCT GAA GTG GCT TTA AAA GAG TTG CTC TAT TGG 480 
Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Trp 
665 670 675 

AAA ACA CGC TAC CAT GAC AAT TTA AAA GAC ATG ATT AAA TCT TAC AAC 52 8 

Lys Thr Arg Tyr His Asp Asn Leu Lys Asp Met lie Lys Ser Tyr Asn 
680 685 690 695 

AAG GGC AGT CGT TGG GAA AGG AGC GAA AAA TCT AAC GCT GAT GCT GAA 576 
Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
700 705 710 

AAA TAT TAC GAA GAG ATA CAA GAC AGA ATC AGG CGT TTG AAA GAA TCT 624 
Lys Tyr Tyr Glu Glu He Gin Asp Arg He Arg Arg Leu Lys Glu Ser 
715 720 725 

AAA ATC TTT GAT TCG CAG TCT AGT AAT GAC CAA GAA TTG CAA AAA AGC 672 
Lys He Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
730 735 740 

£CT AAT AGC AAC CTG GAT TTA GAC CCT ATC GGC AAC GCC ATG CCC CAA 720 
"■a Asn Ser Asn Leu Asp Leu Asp Pro He Gly Asn Ala Met Pro Gin 
745 750 755 



• 

9 Q A 



GCC TTA ATT GCC AAA GAA ACT AAA ATA GAA GAA ACC CAA GCA GAA AAA 768 
Ala Leu He Ala Lys Glu Thr Lys He Glu Glu Thr Gin Ala Glu Lys 
7 60 765 770 775 

TCC CAA GAA ATG AAA GAG ACA ACT AGC GAG CAA ACA AAA AGT AAG CCA 816 
Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
780 785 790 

GAA AAA GCA AAA GAT AAA CCC ATG TAT TTG GCG CAA ATC AAC AGC ACT 864 
Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin He Asn Ser Thr 
795 800 805 

GAT TTC ACA CCC GTT AAA AAA AGC CCC AAA AAA CCG GCT AAA GTG AGC 912 
Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
810 815 820 

CAA AAA CAC TCC TTT AAG AAT AAC ATT AAA AAT AAT GTA AAA AAC AAC 960 
Gin Lys His Ser Phe Lys Asn Asn He Lys Asn Asn Val Lys Asn Asn 
825 830 835 



p AAA ACC GCT TCC AAA AAA CAA GAA ATG TGC AAA AAT TGC TCT CCA 1008 
^ .a Lys Thr Ala Ser Lys Lys Gin Glu Met Cys Lys Asn Cys Ser Pro 
840 845 850 855 

GGG CAA AGG AAT GCG ATT TTA GCT AAC CAC ATC ACT CTC ATG CAA GAG 1056 
Gly Gin Arg Asn Ala He Leu Ala Asn His He Thr Leu Met Gin Glu 
860 865 870 



CTT TAA 
Leu * 



1062 



(2) ANGABEN ZU SEQ ID NO: 50: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 354 Aminosauren 

(B) ART: Aminosaure 
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(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 50: 

Leu Lys His Leu Thr Pro Leu Thr His Thr lie Phe Lys Ala Leu Trp 
15 10 15 

Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
20 25 30 

Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys Asn Lys Pro 
35 40 45 

Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn lie Lys 
50 55 60 

Asp Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
65 70 75 80 



Gly Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly lie Ala Trp Lys 
85 90 95 



*lu Ser Cys Ala Gly Val Tyr Lys lie Asn Phe Ser Asp Pro Ser Ala 
100 105 110 

Gly Val Tyr His Ser Tyr lie Pro Ser Val Leu Lys Ser Tyr Gly His 
115 120 125 

Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu lie Lys 
130 135 140 

Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Trp 
145 150 155 160 

Lys Thr Arg Tyr His Asp Asn Leu Lys Asp Met lie Lys Ser Tyr Asn 
165 170 175 

Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
180 185 190 



• 



Lys Tyr Tyr Glu Glu lie Gin Asp Arg He Arg Arg Leu Lys Glu Ser 
195 200 205 



s He Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
210 215 220 



Ala Asn Ser Asn Leu Asp Leu Asp Pro He Gly Asn Ala Met Pro Gin 
225 230 235 240 

Ala Leu He Ala Lys Glu Thr Lys He Glu Glu Thr Gin Ala Glu Lys 
245 250 255 

Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
260 265 270 

Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin He Asn Ser Thr 
275 280 285 

Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
290 295 300 



Gin Lys His Ser Phe Lys Asn Asn 
305 310 

Ala Lys Thr Ala Ser Lys Lys Gin 
325 

Gly Gin Arg Asn Ala lie Leu Ala 
340 

Leu * 
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lie Lys Asn Asn Val Lys Asn Asn 
315 320 

Glu Met Cys Lys Asn Cys Ser Pro 
330 335 

Asn His lie Thr Leu Met Gin Glu 
345 350 



(2) ANGABEN ZU SEQ ID NO: 51: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 22 02 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS155 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .2202 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 51: 



ATG GCA AAC GAA CGC TCC AAA TTA GCT TTT AAA AAG ACT TTC CCT GTC 
Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 
355 360 365 370 

TTT AAA CGC TTT TTG CAA TCC AAA GAC TTA GCC CTT GTG GTC TTT GTG 
Phe Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 
375 380 385 

ATC GCT ATT TTG GCG ATC ATT ATC GTG CCG TTA CCG CCT TTT GTG TTG 
lie Ala lie Leu Ala lie lie lie Val Pro Leu Pro Pro Phe Val Leu 
390 395 400 



T TTT TTA CTC ACQ tcg gtg <pTG ATT ATT TTA 

sp Phe Leu Leu Thr He Ser He Ala Leu Ser Val Leu He He Leu 
405 410 415 

ATT GGG CTT TAT ATT GAC AAG CCG ACT GAT TTT AGC GCT TTC CCC ACT 
He Gly Leu Tyr He Asp Lys Pro Thr Asp Phe Ser Ala Phe Pro Thr 
420 425 430 

TTA TTG CTC ATT GTA ACC TTG TAT CGC TTG GCT TTA AAT GTC GCC ACC 
Leu Leu Leu He Val Thr Leu Tyr Arg Leu Ala Leu Asn Val Ala Thr 
435 440 445 450 

ACT AGA ATG ATT TTA ACG CAA GGC TAT AAA GGG CCT AGT GCG GTG AGC 
Thr Arg Met He Leu Thr Gin Gly Tyr Lys Gly Pro Ser Ala Val Ser 
455 460 465 

GAT ATT ATC ACG GCG TTT GGG GAA TTT AGC GTG AGC GGG AAT TAT GTG 
Asp He He Thr Ala Phe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 
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470 475 480 

ATT GGG GCG ATT ATC TTT AGT ATT TTA GTG CTA GTG AAT CTA TTA GTG 432 
lie Gly Ala lie He Phe Ser He Leu Val Leu Val Asn Leu Leu Val 
485 490 495 

GTT ACT AAT GGC TCT ACT AGG GTT ACT GAA GTG AGG GCG CGA TTT GCC 480 
Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
500 505 510 

CTA GAT GCT ATG CCA GGA AAG CAA ATG GCG ATT GAT GCG GAT TTA AAC 52 8 

Leu Asp Ala Met Pro Gly Lys Gin Met Ala He Asp Ala Asp Leu Asn 
515 520 525 530 

TCA GGA CTT ATT GAC GAT AAG GAA GCC AAA AAA CGG CGC GCC GCT CTA 576 
Ser Gly Leu lie Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
535 540 545 

AGC CAA GAA GCG GAT TTT TAT GGC GCG ATG GAT GGC GCA TCT AAA TTC 624 
Ser Gin Glu Ala Asp Phe Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
550 555 560 

STC AAA GGC GAT GCG ATC GCT TCT ATC ATC ATC ACG CTT ATC AAT ATC 672 
Val Lys Gly Asp Ala He Ala Ser He He He Thr Leu He Asn He 
565 570 575 

ATT GGA GGG TTT TTA GTG GGC GTG TTT CAA AGG GAT ATG AGC TTG AGC 72 0 

He Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
580 585 590 

TTT AGC GCT AGC ACT TTC ACT ATC TTA ACC ATT GGC GAT GGG CTT GTG 768 
Phe Ser Ala Ser Thr Phe Thr He Leu Thr He Gly Asp Gly Leu Val 
595 600 605 610 

GGG CAA ATC CCT GCC TTA ATC ATT GCG ACA GCG ACC GGT ATT GTC GCC 816 
Gly Gin He Pro Ala Leu He He Ala Thr Ala Thr Gly He Val Ala 
615 620 625 

ACT CGC ACC ACG CAA AAT GAA GAA GAG GAC TTT GCT TCC AAA CTC ATC 864 
Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu He 
630 635 640 

ACA CAG CTC ACC AAT AAA AGC AAA ACT TTA GTG ATT GTG GGA GCG ATT 912 
"~jhr Gin Leu Thr Asn Lys Ser Lys Thr Leu Val He Val Gly Ala He 
645 650 655 

TTA TTG CTT TTT GCC ACC ATT CCT GGA CTC CCT ACC TTT TCT TTA GCG 960 
Leu Leu Leu Phe Ala Thr He Pro Gly Leu Pro Thr Phe Ser Leu Ala 
660 665 670 

TTT GTA GGG ACT CTC TTT TTA TTC ATC GCA TGG CTG ATT AGC AGG GAG 10 08 

Phe Val Gly Thr Leu Phe Leu Phe He Ala Trp Leu He Ser Arg Glu 
675 680 685 690 

GGG AAA GAC GGG CTG CTC ACT AAA TTA GAA AAT TAT TTG AGT CAA AAA 1056 
Gly Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
695 700 705 

TTC GGC TTG GAT TTG AGC GAA AAA CCC CAC AGC TCC AAA ATC AAA CCC 1104 
Phe Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
710 715 720 
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CAC ACC CCA ACC ACA AGG GCT AAA ACC CAA GAA GAG CTT AAA AGA GAA 1152 
His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
725 730 735 

GAA GAG CAA GCG ATT GAT GAA GTG TTA AAA ATT GAA TTT TTA GAA CTG 1200 
Glu Glu Gin Ala lie Asp Glu Val Leu Lys He Glu Phe Leu Glu Leu 
740 745 750 

GCT TTA GGC TAT CAA CTC ATC AGT CTT GCG GAC ATG AAA CAA GGG GGC 124 8 

Ala Leu Gly Tyr Gin Leu He Ser Leu Ala Asp Met Lys Gin Gly Gly 
755 760 765 770 

GAT TTG TTA GAA AGG ATT AGG GGT ATT AGA AAA AAG ATA GCG AGC GAT 12 96 

Asp Leu Leu Glu Arg He Arg Gly He Arg Lys Lys He Ala Ser Asp 
775 780 785 

TAT GGT TTT TTG ATG CCT CAA ATC CGG ATC AGG GAT AAT TTG CAG CTC 1344 
Tyr Gly Phe Leu Met Pro Gin He Arg He Arg Asp Asn Leu Gin Leu 
790 795 800 

CCC CCA ACG CAT TAT GAA ATC AAA CTT AAA GGC ATT GTG ATT GGT GAG 13 92 

n ro Pro Thr His Tyr Glu He Lys Leu Lys Gly He Val He Gly Glu 
805 810 815 

GGC ATG GTG ATG CCA GAC AAG TTT TTA GCC ATG AAT ACC GGT TTT GTG 1440 
Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
820 825 830 

AAT AAA GAA ATT GAA GGC ATT CCT ACT AAA GAG CCG GCT TTT GGA ATG 1488 
Asn Lys Glu He Glu Gly He Pro Thr Lys Glu Pro Ala Phe Gly Met 
835 840 845 850 

GAC GCT TTA TGG ATT GAA ACT AAA AAT AAA GAA GAA GCC ATT ATT CAA 1536 
Asp Ala Leu Trp He Glu Thr Lys Asn Lys Glu Glu Ala He He Gin 
855 860 865 

GGC TAT ACC ATT ATT GAT CCA AGC ACC GTT ATT GCG ACG CAC ACC AGC 1584 
Gly Tyr Thr He He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
870 875 880 

GAA TTA GTG AAA AAA TAC GCT GAA GAT TTT ATC ACT AAA GAT GAA GTG 1632 
Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
885 890 895 



TCC CTT TTA GAG CGC TTG GCC AAA GAT TAT CCT ACG ATT GTA GAA 1680 
.ys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
900 905 910 

GAG AGT AAA AAA ATC CCC ACC GGT GCG ATC CGA TCA GTC TTG CAA GCC 1728 
Glu Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
915 920 925 930 

TTG TTA CAT GAA AAA ATC CCC ATT AAA GAC ATG CTC ACT ATT TTA GAA 1776 
Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
935 940 945 

ACG ATT ACC GAT ATT GCC CCA TTG GTT CAA AAC GAT GTG AAT ATC TTA 1824 
Thr He Thr Asp He Ala Pro Leu Val Gin Asn Asp Val Asn He Leu 
950 955 960 

ACC GAA CAA GTG AGG GCG AGG CTT TCT AGG GTG ATC ACT AAC GCT TTT 1872 
Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
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965 970 975 

AAA TCT GAA GAC GGG CGT TTG AAA TTT TTA ACC TTT TCT ACC GAT AGC 1920 
Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
980 985 990 

GAA CAA TTT TTG CTT AAT AAA TTG CGA GAA AAT GGC ACT TCT AAA AGT 1968 
Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
995 1000 1005 1010 

TTG CTG CTC AAT GTG GGC GAA TTG CAA AAA CTC ATT GAA GTG GTC TCT 2016 
Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu lie Glu Val Val Ser 
1015 1020 1025 

GAA GAG GCC ATG AAA GTC TTG CAA AAA GGG ATC GCT CCG GTG ATT TTG 2064 
Glu Glu Ala Met Lys Val Leu Gin Lys Gly lie Ala Pro Val lie Leu 
1030 1035 1040 



ATC GTA GAG CCT AAT TTA AGA AAA GCT CTT TCC AAT CAA ATG GAG CAA 2112 
lie Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
1045 1050 1055 



CC AGG ATT GAT GTG ATC GTG CTA AGC CAT GCG GAA TTA GAT CCT AAC 2160 
la Arg lie Asp Val lie Val Leu Ser His Ala Glu Leu Asp Pro Asn 
1060 1065 1070 

TCT AAT TTT GAA GCT TTA GGC ACG ATC CAT ATT AAC TTT TAA 2202 
Ser Asn Phe Glu Ala Leu Gly Thr lie His lie Asn Phe * 
1075 1080 1085 



(2) ANGABEN ZU SEQ ID NO: 52: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 734 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 52: 



Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 
15 10 15 



e Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 
20 25 30 



lie Ala lie Leu Ala He He He Val Pro Leu Pro Pro Phe Val Leu 
35 40 45 

Asp Phe Leu Leu Thr He Ser He Ala Leu Ser Val Leu He He Leu 
50 55 60 

He Gly Leu Tyr He Asp Lys Pro Thr Asp Phe Ser Ala Phe Fro Thr 
65 70 75 80 

Leu Leu Leu He Val Thr Leu Tyr Arg Leu Ala Leu Asn Val Ala Thr 
85 90 95 

Thr Arg Met He Leu Thr Gin Gly Tyr Lys Gly Pro Ser Ala Val Ser 
100 105 110 
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Asp He He Thr Ala Phe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 
H5 120 125 

He Gly Ala He He Phe Ser He Leu Val Leu Val Asn Leu Leu Val 
130 135 
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Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
145 150 155 160 

Leu Asp Ala Met Pro Gly Lys Gin Met Ala He Asp Ala Asp Leu Asn 
1^5 170 175 

Ser Gly Leu He Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
180 185 190 

Ser Gin Glu Ala Asp Phe Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
!95 200 205 

Val Lys Gly Asp Ala He Ala Ser He He He Thr Leu He Asn He 
210 215 220 

le Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
25 230 235 240 

Phe Ser Ala Ser Thr Phe Thr He Leu Thr He Gly Asp Gly Leu Val 
245 250 255 

Gly Gin He Pro Ala Leu He He Ala Thr Ala Thr Gly He Val Ala 
260 265 270 

Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu He 
275 280 285 

Thr Gin Leu Thr Asn Lys Ser Lys Thr Leu Val He Val Gly Ala He 
290 295 300 

Leu Leu Leu Phe Ala Thr He Pro Gly Leu Pro Thr Phe Ser Leu Ala 
305 310 315 320 

Phe Val Gly Thr Leu Phe Leu Phe He Ala Trp Leu He Ser Arg Glu 
325 330 335 

Gly Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
^ 340 345 350 



Le Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
355 360 365 

His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
370 375 380 

Glu Glu Gin Ala He Asp Glu Val Leu Lys He Glu Phe Leu Glu Leu 
385 390 395 400 

Ala Leu Gly Tyr Gin Leu He Ser Leu Ala Asp Met Lys Gin Glv Glv 
405 410 415 

Asp Leu Leu Glu Arg He Arg Gly He Arg Lys Lys He Ala Ser Asp 
420 425 430 

Tyr Gly Phe Leu Met Pro Gin He Arg He Arg Asp Asn Leu Gin Leu 
435 440 445 
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Pro Pro Thr His Tyr Glu lie Lys Leu Lys Gly lie Val lie Gly Glu 
450 455 460 

Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
465 470 475 480 

Asn Lys Glu lie Glu Gly lie Pro Thr Lys Glu Pro Ala Phe Gly Met 
485 490 495 

Asp Ala Leu Trp lie Glu Thr Lys Asn Lys Glu Glu Ala lie He Gin 
500 505 510 

Gly Tyr Thr He He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
515 520 525 

Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
530 535 540 

Lys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
545 550 555 560 

lu Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
565 570 575 

Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
580 585 590 

Thr lie Thr Asp lie Ala Pro Leu Val Gin Asn Asp Val Asn lie Leu 
595 600 605 

Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
610 615 620 

Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
625 630 635 640 

Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
645 650 655 

Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu He Glu Val Val Ser 
660 665 670 

Glu Glu Ala Met Lys Val Leu Gin Lys Gly He Ala Pro Val He Leu 
675 680 685 

le Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
690 695 700 

Ala Arg lie Asp Val He Val Leu Ser His Ala Glu Leu Asp Pro Asn 
705 710 715 720 

Ser Asn Phe Glu Ala Leu Gly Thr lie His He Asn Phe * 
725 730 

(2) ANGABEN ZU SEQ ID NO: 53: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 189 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

( D ) TOPOLOGIE : 1 inear 
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(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC157 (HPC181) 

(ix) MERKMAL; 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..189 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 53: 

ATG CAA AAA GAA CAA GAA GCC CGA GAA ATC GCT AAA AAA GCC GTT CAA 48 
Met Gin Lys Glu Gin Glu Ala Arg Glu lie Ala Lys Lys Ala Val Gin 
? 35 740 745 750 

ATC GTG TTT TTT TTA GGG ATT GTG GTG GTG CTT TTG ATG ATG ATA AAC 96 
lie Val Phe Phe Leu Gly lie Val Val Val Leu Leu Met Met lie Asn 
755 760 765 

CTT TAC ATG CTC ATC AAT CAA ATC AAC GCG AGC GCT AAA ATG AGC CAA 144 
Leu Tyr Met Leu lie Asn Gin lie Asn Ala Ser Ala Lys Met Ser Gin 
770 775 780 

r CAA ATC AAA AAA ATA GAA GAA AGG CTT AAC CAA GGG CAA AAA TAG 189 
Gin lie Lys Lys lie Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
785 790 795 



(2) ANGABEN ZU SEQ ID NO: 54: 

( i ) SEQUENZKENNZE ICHEN : 

(A) LANGE: 63 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 54: 

Met Gin Lys Glu Gin Glu Ala Arg Glu He Ala Lys Lys Ala Val Gin 
1 5 10 15 

He Val Phe Phe Leu Gly He Val Val Val Leu Leu Met Met He Asn 
20 25 30 



u Tyr Met Leu lie Asn Gin He Asn Ala Ser Ala Lys Met Ser Gin 
35 40 45 



Gin He Lys Lys He Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
50 55 60 

(2) ANGABEN ZU SEQ ID NO: 55: 

( i ) SEQUENZKENNZE ICHEN : 

(A) LANGE: 1008 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS183 
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(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1. .1008 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 55: 

ATG TTA GTT ACT CGC TTT AAA AAA GCT TTC ATT TCT TAT TCT TTA GGC 4 8 

Met Leu Val Thr Arg Phe Lys Lys Ala Phe lie Ser Tyr Ser Leu Gly 
65 70 75 

GTG CTT GTC GCT TCA TTA TGG TTG AAC GTG TGC AAC GCT TCA GCG CAA 96 
Val Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
80 85 90 95 

GAA GTC AAA GTC AAG GAT TAT TTC GGG GAG CAA ACC ATC AAG CTT CCT 144 
Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr lie Lys Leu Pro 
100 105 110 

GTT TCT AAA ATA GCC TAT ATA GGG AGC TAT GTA GAA GTG CCT GCC ATG 192 
Val Ser Lys lie Ala Tyr lie Gly Ser Tyr Val Glu Val Pro Ala Met 
115 120 125 

TT AAT GTT TGG AAT AGG GTT GTA GGC GTT TCG GAT TAC GCT TTT AAA 24 0 

Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
130 135 140 

GAC GAT ATT GTC AAA GCC ACT CTC AAA GGC GAA GAT CTT AAA CGC GTC 2 88 

Asp Asp lie Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val 
145 150 155 

AAA CAC ATG AGC ACT GAT CAT ACA GCC GCG CTA AAT GTA GAG CTT TTA 336 
Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu 
160 165 170 175 

AAA AAG CTT AGC CCT GAT CTT GTG GTA ACC TTT GTG GGC AAC CCT AAA 3 84 

Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys 
180 185 190 

GCG GTA GAG CAT GCG AAA AAA TTT GGT ATA TCA TTT CTT TCT TTT CAA 432 
Ala Val Glu His Ala Lys Lys Phe Gly lie Ser Phe Leu Ser Phe Gin 
195 200 205 



rAG ACA ACG ATT GCA GAG GCC ATG CAG GCC ATG CAA GCT CAA GCC ACG 4 80 

u Thr Thr lie Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
210 215 220 



GTT TTA GAG ATT GAC GCT TCC AAA AAA TTC GCC AAA ATG CAA GAA ACT 528 
Val Leu Glu lie Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
225 230 235 

TTG GAT TTT ATT GCT GAG CGT TTG AAA AAT GTC AAA AAG AAA AAG GGG 576 
Leu Asp Phe lie Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lys Gly 
240 245 250 255 

GTG GAG CTT TTC CAT AAA GCC AAT AAA ATC AGC GGC CAT CAA GCC ATT 624 
Val Glu Leu Phe His Lys Ala Asn Lys lie Ser Gly His Gin Ala He 
260 265 270 

AGC TCA GAC ATT TTA GAA AAA GGG GGC ATA GAC AAT TTT GGC TTG AAA 672 
Ser Ser Asp He Leu Glu Lys Gly Gly He Asp Asn Phe Gly Leu Lys 
275 280 285 
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TAT GTC AAA TTT GGG CGT GCT GAC ATT AGC GTG GAA AAA ATC GTT AAA 

Tyr Val Lys Phe Gly Arg Ala Asp He Ser Val Glu Lys He Val Lys 
290 295 300 

GAA AAC CCT GAG ATT ATC TTT ATT TGG TGG ATA AGC CCA CTC ACG CCT 
Glu Asn Pro Glu He He Phe He Trp Trp He Ser Pro Leu Thr Pro 
305 310 315 

GAA GAT GTG TTA AAC AAC CCC AAA TTT GCT ACC ATC AAA GCC ATT AAA 
Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr He Lys Ala He Lys 
320 325 330 335 

AAC AAG CAG GTT TAT AAA CTC CCC ACA ATG GAT ATT GGC GGG CCT AGA 
Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp He Gly Gly Pro Arg 
340 345 350 

GCC CCA CTC ATA AGT CTT TTT ATC GCT CTA AAA GCC CAC CCT GAA GCC 
Ala Pro Leu He Ser Leu Phe He Ala Leu Lys Ala His Pro Glu Ala 
355 360 365 



TTT AAG GGC GTG GAT ATT AAT GCG ATG GTT AAA GAC TAC TAT AAA GTG 
~he Lys Gly Val Asp He Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
370 375 380 



GTT TTT GAT TTG AAT GAT GCA GAG GTT GAG CCC TTT TTA TGG CAT TAA 
Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
385 390 395 



(2) ANGABEN ZU SEQ ID NO: 56: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 336 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: 

Met Leu Val Thr Arg Phe Lys Lys Ala Phe He Ser Tyr Ser Leu Gly 
1 5 10 15 

Val Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
20 25 30 

lu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr He Lys Leu Pro 
35 40 45 

Val Ser Lys He Ala Tyr He Gly Ser Tyr Val Glu Val Pro Ala Met 
50 55 60 

Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
65 70 75 80 

Asp Asp He Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val 

85 90 95 

Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu 
100 105 110 



Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro 
115 120 125 
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Ala Val Glu His Ala Lys Lys Phe Gly lie Ser Phe Leu Ser Phe Gin 
130 135 140 

Glu Thr Thr lie Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
145 150 155 160 

Val Leu Glu lie Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
165 170 175 

Leu Asp Phe lie Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lys Gly 
180 185 190 

Val Glu Leu Phe His Lys Ala Asn Lys lie Ser Gly His Gin Ala lie 
195 200 205 

Ser Ser Asp lie Leu Glu Lys Gly Gly lie Asp Asn Phe Gly Leu Lys 
210 215 220 

Tyr Val Lys Phe Gly Arg Ala Asp lie Ser Val Glu Lys lie Val Lys 
225 230 235 240 

lu Asn Pro Glu lie lie Phe lie Trp Trp lie Ser Pro Leu Thr Pro 
245 250 255 

Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr lie Lys Ala lie Lys 
260 265 270 

Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp lie Gly Gly Pro Arg 
275 280 285 

Ala Pro Leu lie Ser Leu Phe lie Ala Leu Lys Ala His Pro Glu Ala 
290 295 300 

Phe Lys Gly Val Asp lie Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
305 310 315 320 

Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
325 330 335 



(2) ANGABEN ZU SEQ ID NO: 57: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 240 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMI TTELB ARE HERKUNFT : 
(B) CLON(E) : HPS186 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..240 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 57: 



ATG GGC GGA TTC ACA AGC ATA TGG CAT TGG GTC ATT GTT TTA TTA GTG 
Met Gly Gly Phe Thr Ser lie Trp His Trp Val lie Val Leu Leu Val 
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340 345 350 



ATT 
He 


GTG 
Val 


TTG 
Leu 
355 


Leu 


ill 

Phe 


Gly 


Ala 


7\ 7\ 7\ 

AAA 
Lys 
360 


AAG 
Lys 


ATC 
He 


CCA 
Pro 


GAA 
Glu 


TTG 
Leu 
365 


GCT 
Ala 


AAA 
Lys 


GGT 
Gly 


TTA 
Leu 


GGC AGT 
Gly Ser 
370 


GGG 
Gly 


ATT 
He 


AAG 
Lys 


AAT 
Asn 
375 


TTC 
Phe 


AAA 
Lys 


AAA 
Lys 


GCC 
Ala 


GTG 
Val 
380 


AAA 
Lys 


GAC 
Asp 


GAT 
Asp 


GAA 
Glu 


GAA 
Glu 
385 


GAG 
Glu 


GCT 
Ala 


AAA 
Lys 


AAC 
Asn 


GAG 
Glu 
390 


CCA 
Pro 


AAA 
Lys 


ACC 
Thr 


CTA 
Leu 


GAC 
Asp 
395 


GCT 
Ala 


CAA 
Gin 


GCA 
Ala 


ACG 
Thr 


CAA 
Gin 
400 


ACC 
Thr 


AAA 
Lys 


GTG 
Val 


CAT 
His 


GAG 
Glu 
405 


AGT 
Ser 


AGC 
Ser 


GAG 
Glu 


ATT 
He 


AAA 
Lys 
410 


AGC 
Ser 


AAA 
Lys 


CAA 
Gin 


GAA 
Glu 


AGT 
Ser 
415 


TAA 

* 



96 



144 



192 



240 



(2) ANGABEN ZU SEQ ID NO: 58: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 80 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 58: 

Met Gly Gly Phe Thr Ser He Trp His Trp Val He Val Leu Leu Val 
1 5 10 15 

He Val Leu Leu Phe Gly Ala Lys Lys He Pro Glu Leu Ala Lys Gly 
20 25 30 

Leu Gly Ser Gly He Lys Asn Phe Lys Lys Ala Val Lys Asp Asp Glu 
35 40 45 

Glu Glu Ala Lys Asn Glu Pro Lys Thr Leu Asp Ala Gin Ala Thr Gin 
50 55 60 

Thr Lys Val His Glu Ser Ser Glu He Lys Ser Lys Gin Glu Ser * 
65 70 75 80 



2) ANGABEN ZU SEQ ID NO: 59: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1764 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS188 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1764 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 59: 

ATG AAA AAC TTT TCC CCA CTT TGT TGT TTT AAA AAG CTC AAA AAA CGC 
Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 
85 90 95 

CAT TTA ATC GCT TTG AGC CTG CCC TTG CTT TCT TAT GCT AAT GGC TTT 
His Leu lie Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
100 105 110 

AAA ATC CAA GAG CAA AGC CTG AAT GGC ACG GCT TTA GGC TCG GCG TAT 
Lys lie Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
115 120 125 

GTC GCT GGG GCT AGG GGG GCT GAT GCT TCC TTT TAT AAC CCG GCG AAT 
Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
130 135 140 



K 



ATG GGC TTT ACT AAC GAT TGG GAT GAA AAC AGA AGC GAA TTT GAA ATG 
Met Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
145 150 155 160 




CC ACC ACC GTG ATT AAT ATC CCG GCC TTT AAG TTT CAA GTC CCT ACG 
hr Thr Thr Val He Asn He Pro Ala Phe Lys Phe Gin Val Pro Thr 
165 170 175 

ACT AAT CAA GGC TTG TAT TCG GTT ACG AGC TTA CAA ATT GAT AAA AGC 
Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin He Asp Lys Ser 
180 185 190 

CAA CAA AAT ATT TTA GGC ATC ATC AAC ACT ATA GGG CTT AGC AAT ATC 
Gin Gin Asn He Leu Gly He He Asn Thr He Gly Leu Ser Asn He 
195 200 205 

CTT AAA GCG CTT GGC AAT ACG GCC GCT ACC AAT GGC TTA TCA CAA GCA 
Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
210 215 220 

ATC AAT CGG GTT CAA GQG CTT ATG AAT CTA ACC AAT CAA AAA GTC GTA 
He Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
225 230 235 240 

ACC CTC GCT TCA AAA CCT GAC ACC CAA ATC GTG AAT GGC TGG ACG GGA 
^hr Leu Ala Ser Lys Pro Asp Thr Gin He Val Asn Gly Trp Thr Gly 
245 250 255 

ACG ACT AAT TTT GTT TTA CCC AAA TTC TTT TAT AAA ACG CGC ACG CAT 
Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 
260 265 270 

AAC GGC TTC ACT TTT GGG GGG AGT TTT ACC GCT CCT AGC GGG TTG GGC 
Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
275 280 285 

ATG AAA TGG AAT GGT AAA GGG GGG GAA TTT TTG CAT GAC GTG TTT ATC 
Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe He 
290 295 300 

ATG ATG GTA GAG CTT GCC CCT AGC ATG AGC TAT ACT GTT AAT AAG CAC 
Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 
305 310 315 320 



TTT TCC GTG GGC GTG GGC TTA AGG GGG CTT TAT GCG ACC GGG AGC TTT 
Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
325 330 335 



AAT AAC ACC GTT TAT GTG CCT TTA GAG GGC GCT TCG GTT TTG AGC GCG 
Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
340 345 350 

GAG CAA ATT TTA AAT TTA CCC AAC AAT GTT TTT GCC GAT CAA GTG CCA 
Glu Gin lie Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gin Val Pro 
355 360 365 

AGT AAC ATG ATG ACT TTA TTA GGC AAT ATT GGC TAC CAA CCA GCG CTT 
Ser Asn Met Met Thr Leu Leu Gly Asn lie Gly Tyr Gin Pro Ala Leu 
370 375 380 

AAT TGC CAA AAA GCC GGT GGG GAT ATG AGC GAT CAG AGC TGT CAA GAG 
Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
385 390 395 400 



TTT TAT AAC GGC TTG AAA AAA ATC ATG GGC TAT AGC GGC TTA ATC AAA 
he Tyr Asn Gly Leu Lys Lys He Met Gly Tyr Ser Gly Leu He Lys 
405 410 415 



GCG AGC GCG AAT CTT TAT GGC ACG ACT CAA GTC GTG CAA AAA TCT AAC 
Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
420 425 430 

GGG CAA GGC GTA TCG GGG GGC TAT AGA GTG GGT TCG AGT TTG CGT GTG 
Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
435 440 445 

TTT GAT CAT GGC ATG TTT TCG GTG GTG TAT AAT TCT TCA GTT ACA TTC 
Phe Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 
450 455 460 

AAT ATG AAA GGC GCT CTA GTG GCT ATC ACC GAG CTT GGC CCT TCT TTA 
Asn Met Lys Gly Ala Leu Val Ala He Thr Glu Leu Gly Pro Ser Leu 
465 470 475 480 

GGG AGC GTT TTG ACT AAA GGC AGC TTG AAT ATC AAT GTT TCA CTC CCC 
Gly Ser Val Leu Thr Lys Gly Ser Leu Asn He Asn Val Ser Leu Pro 
485 490 495 



ACC CTA AGC CTA GCC TAC GCC CAC CAA TTT TTT AAA GAC CAT TTA 
In Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
500 505 510 

AGA ATA GAG GGG GTG TTT GAG CGT ACC TTT TGG AGT CAA GGG AAT AAA 
Arg He Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
515 520 525 

TTT TTA GTA ACC CCT GAT TTT GCG AAC GCT ACT TAC AAG GGC TTG AGC 
Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 
530 535 540 



GGA ACG GTG GCT 
Gly Thr Val Ala 
545 

TTA GCG AAT TTT 
Leu Ala Asn Phe 



TCA CTA GAC TCT 
Ser Leu Asp Ser 
550 

AAA AGC GTG ATG 
Lys Ser Val Met 



GAG ACG CTT AAA 
Glu Thr Leu Lys 
555 

AAC ATG GGG GCT 
Asn Met Gly Ala 



AAA ATG GTA GGC 
Lys Met Val Gly 
560 

GGC TGG AGA GAC 
Gly Trp Arg Asp 
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565 570 575 

ACC AAC ACC TTT AGA TTA GGG GTA ACT TAC ATG GGT AAA AGC TTG CGT 
Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 
580 585 590 

TTG ATG GGT GCT ATT GAT TAT GAC CAA GCC CCA AGC CCC CAA GAC GCG 
Leu Met Gly Ala lie Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 
595 600 605 

ATA GGT ATC CCA GAT TCC AAT GGC TAT ACC GTG GCT TTT GGG ACT AAA 
lie Gly lie Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 
610 615 620 

TAC AAT TTT AGG GGC TTT GAT TTA GGC GTA GCG GGG AGT TTC ACT TTT 
Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 
625 630 635 640 

AAA AGC AAC CGC TCC AGT TTG TAT CAA TCC CCA AAC ATT GGG CAA TTG 
Lys Ser Asn Arg Ser Ser Leu Tyr Gin Ser Pro Asn He Gly Gin Leu 
645 650 655 

^ X3A ATC TTT AGC GCC TCT TTA GGC TAT CGC TGG TAA 
'Arg He Phe Ser Ala Ser Leu Gly Tyr Arg Trp * 
660 665 




(2) ANGABEN ZU SEQ ID NO: 60: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 588 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 60: 

Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 
1 5 10 15 

His Leu He Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
20 25 30 

.ys He Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
35 40 45 

al Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
50 55 60 

Met Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
65 70 75 80 

Thr Thr Thr Val He Asn He Pro Ala Phe Lys Phe Gin Val Pro Thr 
85 90 95 

Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin He Asp Lys Ser 
100 105 110 

Gin Gin Asn He Leu Gly He He Asn Thr He Gly Leu Ser Asn He 
115 120 125 



Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
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130 135 140 

lie Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
145 ISO 155 160 

Thr Leu Ala Ser Lys Pro Asp Thr Gin lie Val Asn Gly Trp Thr Gly 
165 170 175 

Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 
180 185 190 

Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
195 200 205 

Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe lie 
210 215 220 

Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 
225 230 235 240 



Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
245 250 255 



sn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
260 265 270 

Glu Gin lie Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gin Val Pro 
275 280 285 

Ser Asn Met Met Thr Leu Leu Gly Asn lie Gly Tyr Gin Pro Ala Leu 
290 295 300 

Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
305 310 315 320 

Phe Tyr Asn Gly Leu Lys Lys lie Met Gly Tyr Ser Gly Leu lie Lys 
325 330 335 

Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
340 345 350 

Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
355 360 365 

he Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 
370 375 380 

Asn Met Lys Gly Ala Leu Val Ala lie Thr Glu Leu Gly Pro Ser Leu 
385 390 395 400 

Gly Ser Val Leu Thr Lys Gly Ser Leu Asn lie Asn Val Ser Leu Pro 
405 410 415 

Gin Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
420 425 430 

Arg lie Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
435 440 445 

Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 
450 455 460 
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Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly 
465 470 475 480 

Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp 
485 490 495 

Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 
500 505 510 

Leu Met Gly Ala He Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 
515 520 525 

He Gly He Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 
530 535 540 

Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 
545 550 555 560 

Lys Ser Asn Arg Ser Ser Leu Tyr Gin Ser Pro Asn He Gly Gin Leu 
565 570 575 

rg He Phe Ser Ala Ser Leu Gly Tyr Arg Trp * 
580 585 

(2) ANGABEN ZU SEQ ID NO: 61: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1443 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT: 
(B) CLON(E) : HPS190 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1443 



(xi) SEQUENZBESCHREIBUNG : SEQ II 

TG GAA TTG AAA AAA ATC GCC CTT ATT 
eu Glu Leu Lys Lys He Ala Leu He 
590 595 

AAT TTT TTA GAC TTG GTG CTA AGG CAT 
Asn Phe Leu Asp Leu Val Leu Arg His 
605 610 

ATA GTG GTT GTC AAA AAT GAG AGC CTT 
He Val Val Val Lys Asn Glu Ser Leu 
625 

ACT TTC GCT TTT TAT TGT TTT GAT GCG 
Thr Phe Ala Phe Tyr Cys Phe Asp Ala 
640 645 

CAA GTG TTA AAC GAT GAG GTG AGC GAT 
Gin Val Leu Asn Asp Glu Val Ser Asp 



►NO: 61: 

TTA GAT GGC ATT GTA GCA AAA 4 8 

Leu Asp Gly He Val Ala Lys 
600 

TAT TCT AAT CAT AAT TTT TAT 96 
Tyr Ser Asn His Asn Phe Tyr 
615 620 

ATC CCT AAA AAT TAC CCG AGC 144 
He Pro Lys Asn Tyr Pro Ser 
630 635 

ACT TCT AGT TTC AGG CTT TTG 192 
Thr Ser Ser Phe Arg Leu Leu 
650 

GCG TTT TTA ATC ATA CAA GAT 240 
Ala Phe Leu He He Gin Asp 
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655 660 665 

TTT AAA GAA CAG CGC ATC ATT CAT AAA ATC ATT CAA ACC CAT TTC AAA 288 
Phe Lys Glu Gin Arg He He His Lys He He Gin Thr His Phe Lys 
670 675 680 

CGC ATG CGC GTG GTT TTG AGC GTG AAA AAA GAT GGT GAA AAA ACT TTA 33 6 

Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
685 690 695 700 

GAA AAT AAT GAA GAA AAT AAA GAT GAA AAG CTT ATT TTG ATT GAT GAA 384 
Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu He Leu lie Asp Glu 
705 710 715 

TTT GAA GTT TTA GCC AAT AAA TTC ATT TCT CGT TTG CCT AAT ATC CCT 432 
Phe Glu Val Leu Ala Asn Lys Phe He Ser Arg Leu Pro Asn He Pro 
720 725 730 

AGC ACC CCT AGA GAA TTT GGG TTA GCC AAA GGC GAG ATC ATG GAG ATT 480 
Ser Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu He Met Glu He 
735 740 745 

tAT GTG CCT TTT GGG AGT ATT TTT CCT TAC AGG CAT ATT GGC TCT ATC 52 8 

Asp Val Pro Phe Gly Ser He Phe Pro Tyr Arg His He Gly Ser He 
750 755 760 

AGC CAA CAA GAA TAC AGG ATT GTA GGG CTT TAT CGC AAC GAT GTT TTG 576 
Ser Gin Gin Glu Tyr Arg He Val Gly Leu Tyr Arg Asn Asp Val Leu 
765 770 775 780 

TTG CTC TCC ACT AAA TCT TTA GTT ATC CAG CCA CGA GAC ATT CTT TTA 624 
Leu Leu Ser Thr Lys Ser Leu Val He Gin Pro Arg Asp He Leu Leu 
785 790 795 

GTG GCG GGT AAT CCG GAA ATT TTA AAC GCG GTG TAT CTT CAG GTC AAA 672 
Val Ala Gly Asn Pro Glu He Leu Asn Ala Val Tyr Leu Gin Val Lys 
800 805 810 

AGC AAT GTC GGG CAG TTC CCA GCC CCC TTT GGT AAG AGC ATT TAT TTA 720 
Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser He Tyr Leu 
815 820 825 

TAC ATT GAT ATG CGC TTA CCA AAG CCG AAA GCA ATG ATG CCC GAT GTG 768 
^-r He Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
830 835 840 

'AT CAA GCC TTG TTT TTG CAC AAA CAT TTA AAG AGC TAC AAG CTC TAC 816 
Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
845 850 855 860 

ATT CAG GTT TTA CAC CCC ACT AGC CCT AAG TTT TGC CAT AAA TTT TTA 864 
He Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
865 870 875 

TCG CTA GAA ACC GAA AGC ATT GAA GTG AAT TTT GAT TTT TAT GGG AAA 912 
Ser Leu Glu Thr Glu Ser He Glu Val Asn Phe Asp Phe Tyr Gly Lys 
880 885 890 

AGT TTT ATC CAA AAA CTC CAT GAA GAC CAC CAG AAA AAA ATG GGT TTG 960 
Ser Phe He Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
895 900 905 
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ATT GTG GTA GGC AGA GAG CTT TTT TTA TCT AAA AAA CAC CGA AAA GCC 
lie Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
910 915 920 

CTA TAT AAA ACA GCC ACC CCG GTT TAT AAA ACC AAC ACT TCC GGC TTG 
Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
925 930 935 940 

TCT AAA ACC TCT CAA AGC GTG GTG GTG TTG AAT GAA AGC TTG GAT ATC 
Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp lie 
945 950 955 

AAT GAG GAC ATG TCT TCA GTG ATC TTT GAT GTG TCT ATG CAA ATG GAT 
Asn Glu Asp Met Ser Ser Val He Phe Asp Val Ser Met Gin Met Asp 
960 965 970 

TTG GGC TTG TTG CTC TAT GAT TTT GAC CCT AAC AAG CGC TAT AAA AAC 
Leu Gly Leu Leu Leu Tyr Asp Phe Asp Pro Asn Lys Arg Tyr Lys Asn 
975 980 985 



» 



£AG ATT GTC AAT CAT TAT GAA AAT TTA GCC AAC ACG CTC AAC CGC AAG 
lu He Val Asn His Tyr Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys 
990 995 1000 




ATT GAG ATT TTT CAA ACC GAT ATT AGA AAT CCT ATC ATG TAT CTC AAT 
He Glu He Phe Gin Thr Asp He Arg Asn Pro He Met Tyr Leu Asn 
1005 1010 1015 1020 

TCT TTA AGA AAT CCC ATT TTG CAT TTC ATG CCT TTT GAA GAG TGC ATC 
Ser Leu Arg Asn Pro He Leu His Phe Met Pro Phe Glu Glu Cys He 
1025 1030 1035 

ACG CAC ACG CGC TTT TGG TGG TTT TTA TCC ACT AAA GTG GAA AAA TTA 
Thr His Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu Lys Leu 
1040 1045 1050 

GCG TTT TTA AAC GAT GAT AAC CCT CAA ATT TTT ATC CCT GTA GCG GAG 

Ala Phe Leu Asn Asp Asp Asn Pro Gin He Phe He Pro Val Ala Glu 
1055 1060 1065 

TGA 



2) ANGABEN ZU SEQ ID NO: 62: 



( i) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 481 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) S EQUENZ BESCHRE I BUNG : SEQ ID NO: 62: 

Leu Glu Leu Lys Lys He Ala Leu He Leu Asp Gly He Val Ala Lys 
1 5 10 15 

Asn Phe Leu Asp Leu Val Leu Arg His Tyr Ser Asn His Asn Phe Tyr 
20 25 30 

He Val Val Val Lys Asn Glu Ser Leu He Pro Lys Asn Tyr Pro Ser 
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35 40 45 

Thr Phe Ala Phe Tyr Cys Phe Asp Ala Thr Ser Ser Phe Arg Leu Leu 
50 55 60 

Gin Val Leu Asn Asp Glu Val Ser Asp Ala Phe Leu lie lie Gin Asp 
65 70 75 80 

Phe Lys Glu Gin Arg He He His Lys He He Gin Thr His Phe Lys 
85 90 95 

Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
100 105 110 

Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu He Leu He Asp Glu 
115 120 125 

Phe Glu Val Leu Ala Asn Lys Phe He Ser Arg Leu Pro Asn He Pro 
130 135 140 

Ser Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu He Met Glu He 

150 155 160 

sp Val Pro Phe Gly Ser He Phe Pro Tyr Arg His He Gly Ser He 
165 170 175 

Ser Gin Gin Glu Tyr Arg He Val Gly Leu Tyr Arg Asn Asp Val Leu 
180 185 190 

Leu Leu Ser Thr Lys Ser Leu Val He Gin Pro Arg Asp He Leu Leu 
195 200 205 

Val Ala Gly Asn Pro Glu He Leu Asn Ala Val Tyr Leu Gin Val Lys 
210 215 220 

Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser He Tyr Leu 
225 230 235 240 

Tyr He Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
245 250 255 



• 



Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
260 265 270 



e Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
2 75 280 285 



Ser Leu Glu Thr Glu Ser He Glu Val Asn Phe Asp Phe Tyr Gly Lys 
2 90 295 300 

Ser Phe He Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
3 °5 310 315 320 

He Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
325 330 335 

Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
340 345 350 

Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp He 
355 360 365 
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Asn Glu Asp Met 
370 

Leu Gly Leu Leu 
385 

Glu lie Val Asn 



lie Glu lie Phe 
420 

Ser Leu Arg Asn 
435 

Thr His Thr Arg 
450 

Ala Phe Leu Asn 
465 



Ser Ser Val lie 
375 

Leu Tyr Asp Phe 
390 

His Tyr Glu Asn 
405 

Gin Thr Asp lie 



Pro lie Leu His 
440 

Phe Trp Trp Phe 
455 

Asp Asp Asn Pro 
470 



Phe Asp Val Ser 
380 



Asp Pro Asn Lys 
395 

Leu Ala Asn Thr 
410 

Arg Asn Pro lie 
425 

Phe Met Pro Phe 



Leu Ser Thr Lys 
460 

Gin lie Phe lie 
475 



Met Gin Met Asp 



Arg Tyr Lys Asn 
400 

Leu Asn Arg Lys 
415 

Met Tyr Leu Asn 
430 

Glu Glu Cys lie 
445 

Val Glu Lys Leu 



Pro Val Ala Glu 
480 



(2) ANGABEN ZU SEQ ID NO: 63: 

( i ) S E QUEN Z KENNZE I CHEN : 

(A) LANGE: 543 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPC008 (HPC114, HPC145) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..543 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 63: 



G AAA AGC ATG CGT TTT AGC TAT ATT GAG CCA AGA GCG AAA TAC CTT 4 8 

6t Lys Ser Met Arg Phe Ser Tyr lie Glu Pro Arg Ala Lys Tyr Leu 
485 490 495 

ATC AGC AAG CTT TCT AAA ATT TGG GTT TTT TAC ATT TTT TTA TCT TTT 96 
lie Ser Lys Leu Ser Lys lie Trp Val Phe Tyr He Phe Leu Ser Phe 
500 505 510 

GTG GTG ATA GGG GGG TTA GTG TGG TTT ATG CAC AAC GCC ATT AAA AGC 144 
Val Val He Gly Gly Leu Val Trp Phe Met His Asn Ala He Lys Ser 
515 520 525 

ACT CAA GAC AAC GCG TCC AGT TTG ACG ATC CAA GAA AGG CTC TAC CGC 192 
Thr Gin Asp Asn Ala Ser Ser Leu Thr He Gin Glu Arg Leu Tyr Arg 
530 535 540 545 



CAT GAA ATC ATC CGC TTA CAG GTT AAG ACT GAT GAA ACC TTA AAA CTC 24 0 

His Glu He He Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 
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550 555 560 

ATT AAA GAA GCC AAA AAG CGT TTG AAT TAT AAC GAT GAT ATA CGA GAT 
lie Lys Glu Ala Lys Lys Arg Leu Asn Tyr Asn Asp Asp lie Arg Asp 
565 570 575 

GTT TTG CAA GGG CTT TTG AAT ATT GTG CCG GAT TCC ATC ACT ATT AAT 
Val Leu Gin Gly Leu Leu Asn lie Val Pro Asp Ser lie Thr lie Asn 
580 585 590 

AGC ATT GAA ATA GAC CAG CAA AGC GTA GTG GTT AGT GGT AAA ACC CCT 
Ser lie Glu He Asp Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
595 600 605 

TCT AAA GAA GCC TTT TAT TTT TTG TTT CAA AAC AAA CTA AAC CCC ATG 
Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
610 615 620 625 



JV 

AS! 



TTT GAT TAT TCT AGG GCG GAA TTT TTC CCT TTA AGC GAC GGG TGG TTT 

Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
630 635 640 

4 T TTT GTC TCC ACC AAC TTT TCT AAT TCC TTA CTG ATA AAA AAT CCG 

Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu He Lys Asn Pro 
645 650 655 



GAG TCT ATT AAA TGA 
Glu Ser He Lys * 
660 



(2) ANGABEN ZU SEQ ID NO: 64: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 181 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 64: 

Met Lys Ser Met Arg Phe Ser Tyr He Glu Pro Arg Ala Lys Tyr Leu 
15 10 15 

le Ser Lys Leu Ser Lys He Trp Val Phe Tyr He Phe Leu Ser Phe 
20 25 30 

Val Val He Gly Gly Leu Val Trp Phe Met His Asn Ala He Lys Ser 
35 40 45 

Thr Gin Asp Asn Ala Ser Ser Leu Thr He Gin Glu Arg Leu Tyr Arg 
50 55 60 

His Glu He He Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 
65 70 75 80 

He Lys Glu Ala Lys Lys Arg Leu Asn Tyr Asn Asp Asp He Arg Asp 
85 90 95 



Val Leu Gin Gly Leu Leu Asn He Val Pro Asp Ser He Thr He Asn 
100 105 110 
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Ser He Glu He Asp Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
115 120 125 

Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
130 135 140 

Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
145 150 155 160 

Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu He Lys Asn Pro 
165 170 175 

Glu Ser He Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 65: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1746 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS013 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1746 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 65: 

ATG AAA AAA TTG GTT TTA GTC ATC TTT TTA ACG CTA GCG CTT TCA ATA 4 8 

Met Lys Lys Leu Val Leu Val He Phe Leu Thr Leu Ala Leu Ser He 

185 190 195 

TCT GCA AAA GAA GTC AAA ATA GTG TTT TTA GAA ACT TCA GAC ATT CAT 96 

Ser Ala Lys Glu Val Lys He Val Phe Leu Glu Thr Ser Asp He His 

200 205 210 



CGG CTT TTT TCG TAT GAT TAT GCG ATT GGC GAG CAA AAA CCC AAT 144 
ly Arg Leu Phe Ser Tyr Asp Tyr Ala He Gly Glu Gin Lys Pro Asn 
215 220 225 



AAC GGC TTG ACA AGG ATT GCG ACT TTA ATC AAA AAG CAA AGG GCT GAG 192 
Asn Gly Leu Thr Arg He Ala Thr Leu He Lys Lys Gin Arg Ala Glu 
230 235 240 245 

AAT AAA AAT GTG GTT TTG ATT GAC AGC GGG GAT TTG TTG CAA GGC AAT 24 0 

Asn Lvs Asn Val Val Leu He Asp Ser Gly Asp Leu Leu Gin Gly Asn 
250 255 260 

AGC GCG GAG TTG TTT AAT GAT GAG CCA ATT CAT CCG CTA GTT AGA GCT 2 88 

Ser Ala Glu Leu Phe Asn Asp Glu Pro He His Pro Leu Val Arg Ala 
265 270 275 

GAA AAC GAT TTG AAA TTT GAC ATT CGT GTG CTT GGC AAT CAC GAG TTT 336 
Glu Asn Asp Leu Lys Phe Asp He Arg Val Leu Gly Asn His Glu Phe 
280 285 290 



100 



0 




AAT TTC AGT AAA GAT TTT TTA GAA AAG AAT ATT AAG GGG TTT AAT GGC 384 
Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn lie Lys Gly Phe Asn Gly 
295 300 305 

GAT GTC ATG AAT GCG AAT ATC ATT AAA ATT GCG GAC AAT AAG CCG TTT 43 2 

Asp Val Met Asn Ala Asn lie lie Lys lie Ala Asp Asn Lys Pro Phe 
310 315 320 325 

GTA AAA CCT TAT ATT ATT AAA AAA ATT GAT GGC GTG AGG GTG GCG GTT 48 0 

Val Lys Pro Tyr He He Lys Lys He Asp Gly Val Arg Val Ala Val 
330 335 340 

GTG GGG TAT GTG GTG GCG CAC ATC CCA ACT TGG GAG GCC TCT ACG CCT 52 8 

Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ser Thr Pro 
345 350 355 

GAA CAT TTT GCA GGA TTG AAG TTT TTG GAC GCT GAA GAA GCG TTA AAA 576 
Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
360 365 370 

lG ACC TTA AAA GAG TTG AAA GGG AAG TAT GAT ATT TTG ATT GGC GCT 624 
s Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp He Leu He Gly Ala 
375 380 385 

TTT CAT TTG GGG CGA GAA GAT GAG AAA GGT GGC GAC GGG ATA CCG GAT 672 
Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly He Pro Asp 
390 395 400 405 

TTA GCG AAA AAA TTC CCG CAA TTT GAC ATC ATT TTT GCA GGG CAT GAG 720 
Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu 
410 415 420 

CAT GCG GTT TAT AAC ACC AAA GTA GGG AAA GTG CAT ACC ATT GAG CCT 768 
His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr He Glu Pro 
425 430 435 

GGA GCG TAT GGG GCT TAT CTG GCA AAG GGC GTG GTG GTA TTT GAC ACT 816 
Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
440 445 450 

AAA ACG AAG AAA AAA ATT ATA ACG ACT GAA AAT TTA CCC ACA AAA GAT 864 
Lys Thr Lys Lys Lys He He Thr Thr Glu Asn Leu Pro Thr Lys Asp 
455 460 465 

'G CCA GAA GAT GAA GAA TTA GCG AAA AAA TAC GAA TAT GTG GAT AAA 912 
^ l1 Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
470 475 480 485 

AAA TCA AAA GAA TAC GCT AAT GAA GTG GTT GGC GAA GTT ACA AAA ACC 960 
Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
490 495 500 

TTT ATT GAC AGG CCT GAT TTT ATC ACA GGA GAA GAA AAA ATC ACC ACG 10 08 

Phe He Asp Arg Pro Asp Phe He Thr Gly Glu Glu Lys He Thr Thr 
505 510 515 

ATG CCC ACC GCC GCC TTG CAA GAA ACA CCG GTG ATA GAA TTG ATT AAT 1056 
Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 
520 525 530 



AAA GTG CAA AAA TAT TAC GCA AAA GCC GAT GTT TCA GCG GCA GCC TTA 
Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 



1104 
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535 540 545 

TTC AAT TTT GGG GCG AAT TTG AAA AAA GGG CCT TTC AAA AGA AAA GAT 1152 
Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
550 555 560 565 

GTC ACT TAT ATT TAC AAG TTC GCT AAT ACG CTC ATT GGA GTG CGT ATA 1200 
Val Thr Tyr lie Tyr Lys Phe Ala Asn Thr Leu He Gly Val Arg He 
570 575 580 

ACG GGT GAA AAT CTG TTG AAA TAC ATG GAA TGG TCA TAC CGA TTT TAC 124 8 

Thr Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
585 590 595 

AAT CAG TTG CAA CCA GGA GAT TTG ACG ATC AGT TTT AAT GAA AAC ATT 12 96 

Asn Gin Leu Gin Pro Gly Asp Leu Thr He Ser Phe Asn Glu Asn He 
600 605 610 



CGC GGC TAT AAC TTT GAT ATG TTT TCT GGC GTG AAA TAC CAG GTT GAT 1344 
Arg Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
615 620 625 



T ACA AAA CCC GCC GGA CAA AGG ATT ATC AAT CCG ACA ATC AAC AAC 13 92 

Val Thr Lys Pro Ala Gly Gin Arg He He Asn Pro Thr He Asn Asn 
630 635 640 645 

AAA CCC ATT GAC CCC AAA GCC ATC TAT AAA TTA GCG ATC AAC AAT TAC 1440 
Lys Pro He Asp Pro Lys Ala He Tyr Lys Leu Ala He Asn Asn Tyr 
650 655 660 

CGA TTC GGA ACA TTA TCC ACG ACA TTG AAT TTG GTT ACA GAC GCT GAT 14 88 

Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
665 670 675 

AGG TAT TAT AAT TCT TAC GAT GAA CTG CAA GAT AAT GGG CAA ATA CGA 153 6 

Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin He Arg 
680 685 690 

GAT TTG ATC ATC AAA TAC ATC ACG GAA GAA AAA GGT GGG AAG GTA ACC 1584 
Asp Leu He He Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
695 700 705 



CCT GAA TTG GAG GGT AAT TGG GAA ATC ATC AAC TAC GAT TTC AAA AAC 1632 
xo Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
0 715 720 725 



CCG TTG TTG GAA AAA TTG AGA GAA AAA TTA AAA GAG GGG AGC ATC AAA 1680 
Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
730 735 740 

ATC CCC ACC TCA AAG GAT GGG AGG ACT TTG AAT GTC AAA TCC ATT AAA 1728 
He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser He Lys 
745 750 755 

GAG AGT GAA GTT AAA TAA 1746 
Glu Ser Glu Val Lys * 
760 



(2) 



ANGABEN ZU SEQ ID NO: 66: 
{ i ) SEQUENZKENNZEICHEN : 
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(A) LANGE: 582 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 66: 

Met Lys Lys Leu Val Leu Val He Phe Leu Thr Leu Ala Leu Ser He 
1 5 10 15 

Ser Ala Lys Glu Val Lys He Val Phe Leu Glu Thr Ser Asp He His 
20 25 30 

Gly Arg Leu Phe Ser Tyr Asp Tyr Ala He Gly Glu Gin Lys Pro Asn 
35 40 45 

Asn Gly Leu Thr Arg He Ala Thr Leu He Lys Lys Gin Arg Ala Glu 
50 55 60 

Asn Lys Asn Val Val Leu He Asp Ser Gly Asp Leu Leu Gin Gly Asn 
65 70 75 80 

er Ala Glu Leu Phe Asn Asp Glu Pro He His Pro Leu Val Arg Ala 
85 90 95 

Glu Asn Asp Leu Lys Phe Asp He Arg Val Leu Gly Asn His Glu Phe 
100 105 110 

Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn He Lys Gly Phe Asn Gly 
115 120 125 

Asp Val Met Asn Ala Asn He He Lys He Ala Asp Asn Lys Pro Phe 
130 135 140 

Val Lys Pro Tyr He He Lys Lys He Asp Gly Val Arg Val Ala Val 
145 150 155 160 

Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ser Thr Pro 
165 170 175 

Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
180 185 190 

ys Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp He Leu He Gly Ala 
195 200 205 

Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly He Pro Asp 
210 215 220 

Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu 
225 230 235 240 

His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr He Glu Pro 
245 250 255 

Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
260 265 270 

Lys Thr Lys Lys Lys He He Thr Thr Glu Asn Leu Pro Thr Lys Asp 
275 280 285 

Val Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
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290 295 300 

Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
305 310 315 320 

Phe lie Asp Arg Pro Asp Phe lie Thr Gly Glu Glu Lys lie Thr Thr 
325 330 335 

Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val lie Glu Leu lie Asn 
340 345 350 

Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 
355 360 365 

Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
370 375 380 

Val Thr Tyr lie Tyr Lys Phe Ala Asn Thr Leu lie Gly Val Arg lie 
385 390 395 400 

hr Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
405 410 415 

sn Gin Leu Gin Pro Gly Asp Leu Thr lie Ser Phe Asn Glu Asn lie 
420 425 430 

Arg Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
435 440 445 

Val Thr Lys Pro Ala Gly Gin Arg lie lie Asn Pro Thr lie Asn Asn 
450 455 460 

Lys Pro lie Asp Pro Lys Ala lie Tyr Lys Leu Ala lie Asn Asn Tyr 
465 470 475 480 

Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
485 490 495 

Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin lie Arg 
500 505 510 



Asp Leu He He Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
515 520 525 



o Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
530 535 540 



Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
545 550 555 560 

He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser He Lys 
565 570 575 

Glu Ser Glu Val Lys * 
580 

(2) ANGABEN ZU SEQ ID NO: 67: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1698 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 
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(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 

(B) CLON(E) : HPS024 (HPS025) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .1698 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 67: 



ATG ATG TTT TCT TCA ATG TTT GCT TCG TTG GGG ACT CGT ATC ATG CTG 4 8 

Met Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg lie Met Leu 
585 590 595 




GTC GTG TTA GCC GCT CTT TTA GGT TTA GGG GGG CTT TTT ATT GGT TTT 
Val Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe lie Gly Phe 
600 605 610 
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TA AAG GTT ATG CAA AAA GAT GTG TTA GCG CAA CTC ATG GAG CAT TTA 144 
al Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
615 620 625 630 

GAA ACC GGG CAA TAC AAA AAG CGT GAA AAA ACG CTC GCT TAC ATG ACA 192 
Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
635 640 645 

AAA ATT ATT GAA CAG GGC ATT CAT GAG TAT TAC AAA AAT TTT GAC AAT 240 
Lys lie lie Glu Gin Gly lie His Glu Tyr Tyr Lys Asn Phe Asp Asn 
650 655 660 

GCT ACT GCA AGA AAA ATG GCG TTA GAT TAT TTC AAA CGC ATC AAC GAC 288 
Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg lie Asn Asp 
665 670 675 

GAT AAG GGC ATG ATT TAT ATG GTG GTG GTG GAT AAA AAC GGG GTG GTA 336 
Asp Lys Gly Met lie Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
680 685 690 



TTG TTT GAT CCG GTC AAT CCT AAA ACC GTA GGC CAA TCA GGG CTT GAC 3 84 

T eu Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 

700 705 710 



GCT CAG AGC GTT GAT GGG GTG TAT TAT GTT AGG GGG TAT TTG GAG GCG 432 
Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
715 720 725 

GCC AAA AAA GGG GGA GGC TAC ACT TAT TAT AAA ATG CCT AAA TAC GAT 480 
Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
730 735 740 

GGA GGC GTA CCG GAG AAA AAA TTC GCC TAC TCG CAT TAT GAT GAA GTT 52 8 

Gly Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
745 750 755 

TCT CAA ATG GTG ATC GCA ACG ACT TCC TAT TAC ACT GAC ATT AAC ACA 576 
Ser Gin Met Val lie Ala Thr Thr Ser Tyr Tyr Thr Asp lie Asn Thr 
760 765 770 
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GAA AAT AAA GCG ATC AAA GAA GGC GTG AAT AAG GTT TTT GAT GAA AAC 624 
Glu Asn Lys Ala lie Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
775 780 785 790 

ACC ACG AAA TTA TTC CTT TGG ATA CTG ACA GCG ACG ATA GCG CTA GTG 672 
Thr Thr Lys Leu Phe Leu Trp He Leu Thr Ala Thr He Ala Leu Val 
795 800 805 

GTT TTG ACG CTC ATA TAC GCT AAA TTA AGG ATC GTG AAA CGC ATT GAT 72 0 

Val Leu Thr Leu He Tyr Ala Lys Leu Arg He Val Lys Arg He Asp 
810 815 820, 

GAA CTG GTC CTT AAA ATC AAC GCT TTT AGC CGT GGG GAT AAG GAT TTG 76 8 

Glu Leu Val Leu Lys He Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
825 830 835 

AGA GCC AAA ATT GAT GTG GGT GAT CGC AAC GAT GAA ATC TCG CAA GTG 816 
Arg Ala Lys He Asp Val Gly Asp Arg Asn Asp Glu He Ser Gin Val 
840 845 850 

£GC CGT GGG ATC AAT TTG TTT GTG GAA AAC GCC CGC TTG ATT ATG GAA 864 
ly Arg Gly He Asn Leu Phe Val Glu Asn Ala Arg Leu He Met Glu 
55 860 865 870 

GAG ATT AAA GGG ATT TCC ACC CTC AAT AAA ACT TCA ATG GAT AAA TTA 912 
Glu He Lys Gly He Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
875 880 885 

GTC CAA ATC ACG CAA GAA ACC CAA AAG AGC ATG AAA GAT TCC TCA ACC 960 
Val Gin He Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
890 895 900 

ACC CTA AAT TCC GTG AAA AAT AAA GCC ACT GAT ATA GCG AGC ATG ATG 1Q08 
Thr Leu Asn Ser Val Lys Asn Lys Ala Thr Asp He Ala Ser Met Met 
905 910 915 

AAT GCT TCC ATA GAG CAA TCT CAA GGG TTA AGG AAG CGT TTG ATT GAA 1056 
Asn Ala Ser He Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu He Glu 
920 925 930 



ACG CAA GGG CTG GTC AAA GAG AGC AAG GAT GCG ATC GGG GAT TTA TTT 1104 
Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala He Gly Asp Leu Phe 
935 940 945 950 



T CAA ATC ACA GAG AGC GCG CAC ACT GAA GAG GAA CTC TCT AGC AAA 1152 
er Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 
955 960 965 

GTG GAG CAG CTA AGC CGT AAC GCT GAT GAT GTC AAA TCC ATT CTG GAT 1200 
Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 
970 975 980 

ATT ATC AAT GAT ATT GCC GAT CAA ACG AAT TTA TTA GCC CTA AAC GCT 124 8 

He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 
985 990 995 

GCT ATT GAA GCC GCA AGG GCT GGC GAG CAT GGC AGA GGC TTT GCG GTG 12 96 

Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 
1000 1005 1010 

GTG GCT GAT GAA GTT AGG AAT TTA GCC GGG CGC ACT CAA AAG TCT TTA 1344 
Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
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1015 1020 1025 1030 

GCC GAA ATC AAT TCC ACT ATC ATG GTG ATT GTC CAA GAA ATC AAT GCC 13 92 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu He Asn Ala 
1035 1040 1045 

GTG AGT TCG CAA ATG AAT CTC AAT TCG CAA AAA ATG GAG CGT TTG AGC 1440 
Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
1050 1055 1060 

GAT ATG AGT AAA AGC GTG CAA GAA ACT TAC GAA AAA ATG AGT TCT AAT 1488 
Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
1065 1070 1075 

TTA AGC TCA GTC GTG TCA GAC AGC AAT CAA AGC ATG GAC GAT TAC GCC 1536 
Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
1080 1085 1090 

AAA TCC GGA CAC CAA ATT GAA GTT ATG GTA AGC GAT TTT GCA GAG GTG 1584 
Lys Ser Gly His Gin He Glu Val Met Val Ser Asp Phe Ala Glu Val 
1095 1100 1105 1110 

AA AAA GTG GCT TCT AAG ACT TTA GCG GAT TCT TCA GAT ATT TTA AAC 163 2 

lu Lys Val Ala Ser Lys Thr Leu Ala Asp Ser Ser Asp He Leu Asn 
1115 1120 1125 

ATC GCT ACG CAT GTG AGT GGA ACG ACC ATG AAT TTA GAC AAA CAA GTG 1680 
He Ala Thr His Val Ser Gly Thr Thr Met Asn Leu Asp Lys Gin Val 
1130 1135 1140 

AAT TTG TTT AAA ACT TAA 1 698 
Asn Leu Phe Lys Thr * 
1145 



(2) ANGABEN ZU SEQ ID NO: 68: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 566 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 68: 

et Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg He Met Leu 
15 10 15 

Val Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe He Gly Phe 
20 25 30 

Val Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
35 40 45 

Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
50 55 60 

Lys He He Glu Gin Gly He His Glu Tyr Tyr Lys Asn Phe Asp Asn 
65 70 75 80 

Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg He Asn Asp 

85 90 95 
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Asp Lys Gly Met lie Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
100 105 110 

Leu Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 
115 120 125 

Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
130 135 140 

Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
145 150 155 160 

Gly Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
165 170 175 

Ser Gin Met Val lie Ala Thr Thr Ser Tyr Tyr Thr Asp lie Asn Thr 
180 185 190 

Glu Asn Lys Ala He Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
195 200 205 

hr Thr Lys Leu Phe Leu Trp He Leu Thr Ala Thr He Ala Leu Val 
210 215 220 

Val Leu Thr Leu He Tyr Ala Lys Leu Arg He Val Lys Arg He Asp 
225 230 235 240 

Glu Leu Val Leu Lys He Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
245 250 255 

Arg Ala Lys He Asp Val Gly Asp Arg Asn Asp Glu He Ser Gin Val 
260 265 270 

Gly Arg Gly He Asn Leu Phe Val Glu Asn Ala Arg Leu He Met Glu 
275 280 285 

Glu lie Lys Gly He Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
290 295 300 

Val Gin He Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
305 310 315 320 

Thr Leu Asn Ser Val Lys Asn Lys Ala Thr Asp He Ala Ser Met Met 
325 330 335 

sn Ala Ser He Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu He Glu 
340 345 350 

Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala He Gly Asp Leu Phe 
355 360 365 

Ser Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 
370 375 380 

Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 
385 390 395 400 

He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 
405 410 415 

Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 
420 425 430 
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Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
435 440 445 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu lie Asn Ala 
450 455 460 

Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
465 470 475 480 

Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
485 490 495 

Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
500 505 510 

Lys Ser Gly His Gin lie Glu Val Met Val Ser Asp Phe Ala Glu Val 
515 520 525 

Glu Lys Val Ala Ser Lys Thr Leu Ala Asp Ser Ser Asp lie Leu Asn 
530 535 540 

le Ala Thr His Val Ser Gly Thr Thr Met Asn Leu Asp Lys Gin Val 
45 550 555 560 

Asn Leu Phe Lys Thr * 
565 

(2) ANGABEN ZU SEQ ID NO: 69: 

{ i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 855 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE : linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS036 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..855 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 69: 

TTG GGT ATC AAT ATG TGT TCT AAA AAA ATA AGA AAT CTC ATT TTA TGC 48 
Leu Gly lie Asn Met Cys Ser Lys Lys lie Arg Asn Leu lie Leu Cys 
570 575 580 

TTT GGT TTT ATG TTG GGC TTG CAC GCT GAA GAA AAT ACG ACT GAA GGA 96 
Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
585 590 595 

AAT ATG ACT GAA GAA AAT ATC TCT AAA GAC GCT CCC ATT CTT TTG GAA 144 
Asn Met Thr Glu Glu Asn lie Ser Lys Asp Ala Pro lie Leu Leu Glu 
600 605 610 

GAA AAA CGC GCC CAA ACG CTA GAA TTT AAA GAA GAA AAG GAA GCT AAA 192 
Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
615 620 625 630 
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AAG AAT ATT GAT GAA AAA AGC CTG CTT GAA GAA ATC CAT AAG AAA AAA 240 
Lys Asn lie Asp Glu Lys Ser Leu Leu Glu Glu lie His Lys Lys Lys 
635 640 645 

CGC CAA CTT TAC ATG CTC AAA GGG GAA TTG CAT GAA AAA AAT GAA TCT 288 
Arg Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 
650 655 660 

CTC TTG TTC CAA CGA ATG GCT AAA AAT AAG AGC GGT TTT TTT ATA GGC 336 
Leu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe lie Gly 
665 670 675 

GTA ATC CTT GGC GAT ATA GGG GTT AGC GCT CAT TCT TAT GAG AAG TTT 384 
Val lie Leu Gly Asp lie Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
680 685 690 

GAA CTT TTA AGC AAT ATT CAA GCT TCT CCT TTG TTG TAT GGC TTA AGG 432 
Glu Leu Leu Ser Asn lie Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
695 700 705 710 

AGC GGG TAT CAA AAG TAT TTT GCT AAC GGG ATT AGC GCC TTA CGC TTT 48 0 

"er Gly Tyr Gin Lys Tyr Phe Ala Asn Gly lie Ser Ala Leu Arg Phe 
715 720 725 

TAT GGG GAG TAT TTA GGG GGG GCG ATG AAA GGA TTT AAA AGC GAT TCT 52 8 

Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
730 735 740 

TTA GCC TCT TAT CAA ACC GCA AGC TTG AAC ATT GAT TTG TTG ATG GAT 576 
Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn lie Asp Leu Leu Met Asp 
745 750 755 

AAG CCT ATT GAC AAA GAA AAA AGG TTT GCG TTA GGG ATA TTT GGA GGC 624 
Lys Pro lie Asp Lys Glu Lys Arg Phe Ala Leu Gly lie Phe Gly Gly 
760 765 770 

GTT GGA GTG GGG TGG AAT GGG ATG TAT CAA AAT TTA AAA GAG GTT AAA 672 
Val Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
775 780 785 790 

GGG TAT TCA CAG CCT AAC GCT TTT GGA TTA GTG CTA AAT TTA GGG GTG 720 
Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
795 800 805 



C ATG ACG CTT AAC CTC AAA CAC CGC TTT GAA TTA GCC TTA AAA ATG 768 
r er Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
810 815 820 

CCT CCC TTA AAA GAA ACT TCG CAA ACC TTT TTA TAT TAT TTT AAA AGC 816 
Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
825 830 835 

ACT AAT ATT TAT TAT ATT AGT TAC AAC TAT TTA TTG TAA 855 
Thr Asn lie Tyr Tyr lie Ser Tyr Asn Tyr Leu Leu * 
840 845 850 



(2) ANGABEN ZU SEQ ID NO: 70: 



( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 285 Aminosauren 

(B) ART : Aminosaure 
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(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtJLS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 70: 

Leu Gly lie Asn Met Cys Ser Lys Lys lie Arg Asn Leu lie Leu Cys 
1 5 10 15 

Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
20 25 30 

Asn Met Thr Glu Glu Asn lie Ser Lys Asp Ala Pro lie Leu Leu Glu 
35 40 45 

Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
50 55 60 

Lys Asn lie Asp Glu Lys Ser Leu Leu Glu Glu lie His Lys Lys Lys 
65 70 75 80 

Arg Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 
85 90 95 

,eu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe He Gly 
100 105 110 

Val He Leu Gly Asp He Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
115 120 125 

Glu Leu Leu Ser Asn He Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
130 135 140 

Ser Gly Tyr Gin Lys Tyr Phe Ala Asn Gly He Ser Ala Leu Arg Phe 
14 5 150 155 160 

Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
165 170 175 

Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn He Asp Leu Leu Met Asp 
180 185 190 

Lys Pro He Asp Lys Glu Lys Arg Phe Ala Leu Gly He Phe Gly Gly 
195 200 205 

al Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
210 215 220 

Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
225 230 235 240 

Ser Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
245 250 255 

Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
260 265 270 

Thr Asn He Tyr Tyr He Ser Tyr Asn Tyr Leu Leu * 
275 280 285 

(2) ANGABEN ZU SEQ ID NO: 71: 

(i) SEQUENZKENNZEICHEN: 



Ill 



(A) LANGE: 669 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS038 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..669 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 71: 

ATG GCT GAA AAT TCT TTC AAA AAT GTT TCC ACA CAA CCC AAA GTA TTT 4 8 

Met Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro Lys Val Phe 
290 295 300 



C TTA TTG CCA GCT AAA ACC CTG TTT CTT TTA GGA GGC GTT TTT AGC 96 
e Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
305 310 315 



GCG TTT TTT ATC CTT ATT GCT GGC TTG GTT TTT TTT GAT TAT GCT CAT 144 
Ala Phe Phe lie Leu lie Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
320 325 330 

TTG ATG GAC AAT GCC ATT TTT AAT TTT GCG CGT TCA ACC CCC TTT AAT 192 
Leu Met Asp Asn Ala He Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
335 340 345 

TCC AGC CCT ATT TTA ACT CTA ATC CTC CAA AAT ATC GCT AAT TTA GGC 24 0 

Ser Ser Pro He Leu Thr Leu He Leu Gin Asn He Ala Asn Leu Gly 
350 355 360 365 

TCT TCT CAA TTC GTG TTG CCT TTG AGT TTG TTG GTG GGG GTG TTT TTA 288 
Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
370 375 380 



AGC CTT TAT CGC AGA AAC TTA GTG CTT GGG GTG TGG TTT GTG TTA AGC 336 
Ser Leu Tyr Arg Arg Asn Leu Val Leu Gly Val Trp Phe Val Leu Ser 
385 390 395 



G ATC TTG TTT GAA GCC CTT TTA GAA TCT TTA AAA CAC CTT TTT GCA 3 84 

al He Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 
400 405 410 

TAT TCC ATT CAG TGG CTT TCG CGC AGC GCT AAT TTC CCT AAC GCT ACT 432 
Tyr Ser He Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 
415 420 425 

GCG CTT TCT TTA GTG CTA TTT TAT GGG TTG CTT ATT TTA TTG ATA CCC 480 
Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu He Leu Leu He Pro 
430 435 440 445 

CAT TTA ATC ACG CAT CAA ACG CTT AAA AAT GTT CTT TTT TAT AGC TTA 52 8 

His Leu He Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 
450 455 460 

TTT GGT TTG ATT TTT TTA ATA GGG TTA GCA CTG ATT GTT TTA GGG GTT 57 6 
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Phe Gly Leu lie Phe Leu lie Gly Leu Ala Leu lie Val Leu Gly Val 
465 470 475 

TCT TTC AGT AGT GTT TTA GGA GGG TTT TGT TTA GGG GCG TTA GGG GCT 
Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 
480 485 490 

TGT TTT TCC ATA GGG ATT TAT TTG AGC GTG TTT CAA AAG ATC TAA 
Cys Phe Ser lie Gly He Tyr Leu Ser Val Phe Gin Lys He * 
495 500 505 



(2) ANGABEN ZU SEQ ID NO: 72: 

( i ) SEQUENZKENNZE ICHEN : 

(A) LANGE: 223 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 72: 

et Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro Lys Val Phe 
1 5 10 15 

Phe Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
20 25 30 

Ala Phe Phe He Leu He Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
35 40 45 

Leu Met Asp Asn Ala He Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
50 55 60 

Ser Ser Pro He Leu Thr Leu He Leu Gin Asn He Ala Asn Leu Gly 
65 70 75 80 

Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
85 90 95 

Ser Leu Tyr Arg Arg Asn Leu Val Leu Gly Val Trp Phe Val Leu Ser 
100 105 110 

al He Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 
k 115 120 125 



r Ser He Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 
130 135 140 

Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu He Leu Leu He Pro 
145 150 155 160 

His Leu He Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 
165 170 175 

Phe Gly Leu He Phe Leu He Gly Leu Ala Leu He Val Leu Gly Val 
180 185 190 

Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 
195 200 205 

Cys Phe Ser He Gly He Tyr Leu Ser Val Phe Gin Lys He * 



210 



215 



220 



(2) ANGABEN ZU SEQ ID NO: 73: 

{ i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 804 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNM I TTE LB ARE HERKUNFT: 

(B) CLON(E): HPS039 (HPS147) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .804 





<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 73: 

iTG TCA GAA AAA GAA AGA CTG AAT GAA GTG ATC TTA GAA GAA GAA AAT 
et Ser Glu Lys Glu Arg Leu Asn Glu Val lie Leu Glu Glu Glu Asn 
225 230 235 

AAT GGG AGC GGC ACT AAA AAG GTG TTT TTG ATC GTG GCT ATA GCC ATT 
Asn Gly Ser Gly Thr Lys Lys Val Phe Leu He Val Ala He Ala He 
240 245 250 255 

ATC ATT TTA GCG GTG CTT TTA ATG GTG TTT TGG AAA AGC ACG AGA GTC 
He He Leu Ala Val Leu Leu Met Val Phe Trp Lys Ser Thr Arg Val 
260 265 270 

GCT CCT AAA GAG ACT TTT TTA CAA ACC GAT AGC GGC ATG CAA AAA ATA 
Ala Pro Lys Glu Thr Phe Leu Gin Thr Asp Ser Gly Met Gin Lys He 
275 280 285 

GGC AAC ACT AAA GAC GAG AAA AAA GAC GAT GAG TTT GAA AGC TTG AAT 
Gly Asn Thr Lys Asp Glu Lys Lys Asp Asp Glu Phe Glu Ser Leu Asn 
290 295 300 

TTG GAT CCT TCC AAG CAA GAA GAC AAG CTA GAC AAA GTG GCG GAT AAT 
eu Asp Pro Ser Lys Gin Glu Asp Lys Leu Asp Lys Val Ala Asp Asn 
305 310 315 

'GTT AAG AAG CAA GAA AAT GAT GCG TTT AAC ATG CCC ACT CAA ACC GAT 
Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
320 325 330 335 

CAA ACT CAA ACG GAG ATG AAA ACA ACA GAA GAA ACG CAA GAA GCT CAA 
Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
340 345 350 

AAA GGA TTA AAA GTT GTT GAG CAC ACT AGC ACT CAA AAA GAA TCT CAA 
Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
355 360 365 

GCT GTG GCT AAA AAA GAA ATC TCC CAT AAA AAG CCT AAA GCA ACC CCT 
Ala Val Ala Lys Lys Glu He Ser His Lys Lys Pro Lys Ala Thr Pro 
370 375 380 
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AAA GAT AAG GAA GCC CAT AAA GAT AAA GAT AAG CAT GCG GTT AAA GAG 
Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
385 390 395 

CTA AAA GTC AAA AAA GAA GCT CAT AAA GAA GTT CCT AAA AAA GCC AAT 
Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
400 405 410 415 

TCT AAA ACC ACT CTT ACT AAA GGG CAT TAT TTG CAA GTG GGG GTT TTT 
Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
420 425 430 

GCG CAC ACG CCC AAT AAA GCC TTT TTG CAA GCG TTT AAC CAA TTC CCC 
Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
435 440 445 

CAT AAG ATT GAA GAT AGG GGG TCT ACT AAA CGC TAT CTC ATA GGC CCT 
His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu lie Gly Pro 
450 455 460 



'AT AAG AAT AAG CAA GAA GCC TTA ATG CAT GCT GAT GAA GTC AGC AAA 
r Lys Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
465 470 475 



AAG ATG ACT AAA CCG GTT GTC ATA GAA GCG CGG TAG 
Lys Met Thr Lys Pro Val Val lie Glu Ala Arg * 
480 485 490 



(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 268 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 74: 

Ser Glu Lys Glu Arg Leu Asn Glu Val lie Leu Glu Glu Glu Asn 
5 10 15 



(2) ANGABEN ZU SEQ ID NO: 74: 



Met 
1 

Asn Gly Ser Gly Thr Lys Lys Val 
20 

e lie Leu Ala Val Leu Leu Met 
35 40 

Ala Pro Lys Glu Thr Phe Leu Gin 
50 55 

Gly Asn Thr Lys Asp Glu Lys Lys 
65 70 

Leu Asp Pro Ser Lys Gin Glu Asp 
85 



Phe Leu lie Val Ala lie Ala lie 
25 30 

Val Phe Trp Lys Ser Thr Arg Val 
45 

Thr Asp Ser Gly Met Gin Lys lie 
60 

Asp Asp Glu Phe Glu Ser Leu Asn 
75 80 

Lys Leu Asp Lys Val Ala Asp Asn 
90 95 



Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
100 105 110 



Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
115 120 125 
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Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
130 135 140 

Ala Val Ala Lys Lys Glu lie Ser His Lys Lys Pro Lys Ala Thr Pro 
145 150 155 160 

Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
165 170 175 

Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
180 185 190 

Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
195 200 205 

Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
210 215 220 



His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu He Gly Pro 
225 230 ■ 235 240 



r Lys Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
245 250 255 



Lys Met Thr Lys Pro Val Val He Glu Ala Arg * 
260 265 

(2) ANGABEN ZU SEQ ID NO: 75: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1545 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS040 

{ ix) MERKMAL : 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1545 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 75: 

GTG AGG CAA GAA AAG TAT TTT CTG ACT TCT TCT TTA TCG CTT TTA TCG 4 8 

Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
270 275 280 

TTT TTA TTA TGT CCT GCA GAA GCT TTT GAT TAT CGC TTT AGC GGT CGT 96 
Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
235 290 295 300 

GTG GAG AAC TTT TCT AAG ATT GGT TTT AAC AAT TCT CAA ATC AAT ACT 144 
Val Glu Asn Phe Ser Lys He Gly Phe Asn Asn Ser Gin He Asn Thr 
305 310 315 

AAA AAA GGG ATT TAT CCT ACT GAA AGT TTT ATA GAT ATT GTA ACT TTA 192 
Lys Lys Gly He Tyr Pro Thr Glu Ser Phe He Asp He Val Thr Leu 
320 325 330 



116 



GCG CAA GTC AAA GTC AAT TTA CTC CCT AAA GGC ACC GAA AAC CAT AGG 240 
Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 
335 340 345 



CTC 
Leu 


TCT 
Ser 
350 


GTC 
Val 


TCT 
Ser 


TTG 
Leu 


GGT GGG 
Gly Gly 
355 


GCG 
Ala 


ATT 
He 


GCA 
Ala 


GCC 
Ala 


ATT 
He 
360 


CCT 
Pro 


TAT GAT 
Tyr Asp 


AAG 
Lys 


288 


ACT 
Thr 
365 


AAA 
Lys 


TAT 
Tyr 


GAT 
Asp 


ATT 
lie 


AAC 
Asn 
370 


CAA 
Gin 


GCT 
Ala 


AAC 
Asn 


GGG 
Gly 


AAG 
Lys 
375 


ATT 
He 


TTT 
Phe 


GGC 
Gly 


TCA 
Ser 


ATT 
He 
380 


336 


GTA 
Val 


GAG 
Glu 


AAT 
Asn 


TTC 
Phe 


ATT 
lie 
385 


GGG 
Gly 


GGC 
Gly 


TAT 
Tyr 


CAT 
His 


GGA TAC 
Gly Tyr 
390 


TTT 
Phe 


TTT 
Phe 


AAT 
Asn 


AAG 
Lys 
395 


TAT 
Tyr 


384 


CTT 
Leu 


GGC 
Gly 


CCT 
Pro 


GCT 
Ala 
400 


TAT 
Tyr 


GCG 
Ala 


GGG ACT 
Gly Thr 


TCT 
Ser 
405 


CAA 
Gin 


TCA 
Ser 


GCG 
Ala 


AGC 
Ser 


TAT 
Tyr 
410 


CAT 
His 


GCA 
Ala 


432 


AGG 

f 


CCT 
Pro 


TAT 
Tyr 
415 


GTG 
Val 


GTG 
Val 


GAT 
Asp 


ACC 
Thr 


GCT 
Ala 
420 


TTT 
Phe 


TTA 
Leu 


CGA 
Arg 


TAC 
Tyr 


GAT 
Asp 
425 


TAC 
Tyr 


AAA 
Lys 


GAT 
Asp 


480 


GTT 
Val 


TTT 
Phe 
430 


GGG 
Gly 


TTT 
Phe 


AAG 
Lys 


GCG GGG CGC 
Ala Gly Arg 
435 


TAT 
Tyr 


GAA 
Glu 


GCG 
Ala 


AAT 
Asn 
440 


ATT 
He 


GAT 
Asp 


TTC 
Phe 


ATG 
Met 


528 


AGC 
Ser 
445 


GGA 
Gly 


TCG 
Ser 


AAT 
Asn 


CAA 
Gin 


GGG 
Gly 
450 


TGG 
Trp 


GAA 
Glu 


GTG 
Val 


TAT 
Tyr 


TAT 
Tyr 
455 


CAG 
Gin 


CCC 
Pro 


TAT 
Tyr 


AAG 
Lys 


ACT 
Thr 
460 


576 


GAA 
Glu 


ACG 
Thr 


CAA 
Gin 


AGG 
Arg 


TTA 
Leu 
465 


AGG 
Arg 


TTT 
Phe 


TGG 
Trp 


TGG 
Trp 


TGG 
Trp 
470 


AGT 
Ser 


TCT 
Ser 


TTT 
Phe 


GGG AGA 
Gly Arg 
475 


GGT 
Gly 


624 


TTA 
Leu 


GCG 
Ala 


TTC 
Phe 


AAC 
Asn 
480 


TCT 
Ser 


TGG 
Trp 


ATT 
He 


TAT 
Tyr 


GAG 
Glu 
485 


TTT 
Phe 


TTT 
Phe 


GCG 
Ala 


ACG 
Thr 


GTG 
Val 
490 


CCT 
Pro 


TAT 
Tyr 


672 


TTG 
Leu 


AAA 
Lys 


AAG 
Lys 
495 


GGA GGC AAT 
Gly Gly Asn 


CCT 
Pro 


AAT 
Asn 
500 


AAC 
Asn 


AGC 
Ser 


AAC GAT 
Asn Asp 


TTC 
Phe 
505 


ATC 
He 


AAT 
Asn 


TAT 
Tyr 


720 




TGG 
Trp 
510 


CAT 
His 


GGA 
Gly 


ATC 
He 


ACC 
Thr 


ACA 
Thr 
515 


ACC 
Thr 


TAT 
Tyr 


TCT 
Ser 


TAT 
Tyr 


AAA 
Lys 
520 


GGT 
Gly 


TTA 
Leu 


GAC 
Asp 


GCT 
Ala 


768 


CAA 
Gin 
525 


TTT 
Phe 


TTT 
Phe 


TAT 
Tyr 


TAT 
Tyr 


TTT 
Phe 
530 


GCG 
Ala 


CCT 
Pro 


AAG 
Lys 


ACT 
Thr 


TAT 
Tyr 
535 


AAC 
Asn 


GCT 
Ala 


CCT 
Pro 


GGC 
Gly 


TTT 
Phe 
540 


O X o 


AAG 
Lys 


CTG 
Leu 


GTC 
Val 


TAT 
Tyr 


GAC 
Asp 
545 


ACG 
Thr 


AAT 
Asn 


AGG 
Arg 


AAT 
Asn 


TTT 
Phe 
550 


CAA 
Gin 


AAT 
Asn 


GTA 
Val 


GGC 
Gly 


TTT 
Phe 
555 


CGC 
Arg 


864 


TCT 
Ser 


CAA 
Gin 


AGC 
Ser 


ATG 
Met 
560 


ATC 
He 


ATG 
Met 


ACA 
Thr 


ACC 
Thr 


TTT 
Phe 
565 


CCT 
Pro 


TTA 
Leu 


TAC 
Tyr 


TAT 
Tyr 


AGA 
Arg 
570 


GGG TGG 
Gly Trp 


912 


TAT 
Tyr 


AAC 
Asn 


CCA 
Pro 


GAG 
Glu 


ACA 
Thr 


AAC 
Asn 


ACT 
Thr 


TAT 
Tyr 


AGT 
Ser 


TTA 
Leu 


GAA 
Glu 


GAC 
Asp 


AGC 
Ser 


ACG 
Thr 


CCT 
Pro 


CAT 
His 


960 
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575 580 585 

GGC TCG TTG TTG GGG AGG AAT GGC GTT ACT TTA AAT ATC CGC CAG GTT 1008 
Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn He Arg Gin Val 
590 595 600 

TTT TGG TGG GAT AAT TTC AAC TGG TCC ATT GGC TTT TAT AAC ACC TTT 1056 
Phe Trp Trp Asp Asn Phe Asn Trp Ser He Gly Phe Tyr Asn Thr Phe 
^05 610 615 620 

GGC AAT TCG GAC GCT TTT TTA GGC TCT CAC ACG ATG CCA AGG GGT AAT 1104 
Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
625 630 635 

AAC ACT TCC TAT ATC GGT AGT GAA ATC TCC ATA ACG ACT AGG CAT GCC 1152 
Asn Thr Ser Tyr He Gly Ser Glu He Ser He Thr Thr Arg His Ala 
640 645 650 

GGA ATG ATT GGC TAT GAT TTT TGG GAT AAT ACG GCT TAT GAT GGG CTA 12 00 

Gly Met He Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
655 660 665 

ICT GAT GCG ATC ACT AAC GCT AAC ACT TTC ACT TTT TAC ACT TCT GTT 124 8 

la Asp Ala He Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
670 675 680 

GGA GGG ATC CAT AAG CGT TTT GCA TGG CAT GTT TTT GGG CGC GTC TCT 12 96 

Gly Gly He His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
685 690 695 700 

CAT GCG AAT AAA AAC GCG TTA GGG CAA GTG GGG AGG GCT AAT GAA TAT 1344 
His Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
705 710 715 

TCC TTG CAA TTC AAC GCG AGC TAT GCG TTC ACT GAA TCA ATC CTT CTT 13 92 

Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr Glu Ser He Leu Leu 
720 725 730 

AAC TTT AGG ATC ACT TAT TAT GGG GCT AGG ATC AAT AAA GGG TAT CAA 1440 
Asn Phe Arg He Thr Tyr Tyr Gly Ala Arg He Asn Lys Gly Tyr Gin 
735 740 745 

GCG GGG TAT TTT GGA GCG CCC AAA TTC AAT AAC CCT GAT GGC GAT TTT 14 88 

"la Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
750 755 760 

.GC GCT AAT TAC CAA GAC AGA AGT TAC ATG ATG ACC AAC CTC ACG CTG 1536 
Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 
765 770 775 780 

AAG TTT TGA 1545 
Lys Phe * 



(2) ANGABEN ZU SEQ ID NO: 76: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 515 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 
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(ii) ART DBS MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 76: 

Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
15 10 15 

Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
20 25 30 

Val Glu Asn Phe Ser Lys lie Gly Phe Asn Asn Ser Gin He Asn Thr 
35 40 45 

Lys Lys Gly He Tyr Pro Thr Glu Ser Phe He Asp He Val Thr Leu 
50 55 60 

Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 
65 70 75 80 



Leu Ser Val Ser Leu Gly Gly Ala He Ala Ala He Pro Tyr Asp Lys 
85 90 95 



r Lys Tyr Asp He Asn Gin Ala Asn Gly Lys He Phe Gly Ser He 
100 105 110 




Val Glu Asn Phe He Gly Gly Tyr His Gly Tyr Phe Phe Asn Lys Tyr 
115 120 125 

Leu Gly Pro Ala Tyr Ala Gly Thr Ser Gin Ser Ala Ser Tyr His Ala 
130 135 140 

Arg Pro Tyr Val Val Asp Thr Ala Phe Leu Arg Tyr Asp Tyr Lys Asp 
145 150 155 160 

Val Phe Gly Phe Lys Ala Gly Arg Tyr Glu Ala Asn He Asp Phe Met 
165 170 175 

Ser Gly Ser Asn Gin Gly Trp Glu Val Tyr Tyr Gin Pro Tyr Lys Thr 
180 185 190 

Glu Thr Gin Arg Leu Arg Phe Trp Trp Trp Ser Ser Phe Gly Arg Gly 
195 200 205 

Leu Ala Phe Asn Ser Trp He Tyr Glu Phe Phe Ala Thr Val Pro Tyr 
210 215 220 

u Lys Lys Gly Gly Asn Pro Asn Asn Ser Asn Asp Phe He Asn Tyr 
225 230 235 240 

Gly Trp His Gly He Thr Thr Thr Tyr Ser Tyr Lys Gly Leu Asp Ala 
245 250 255 

Gin Phe Phe Tyr Tyr Phe Ala Pro Lys Thr Tyr Asn Ala Pro Gly Phe 
260 265 270 

Lys Leu Val Tyr Asp Thr Asn Arg Asn Phe Gin Asn Val Gly Phe Arg 
275 280 285 

Ser Gin Ser Met He Met Thr Thr Phe Pro Leu Tyr Tyr Arg Gly Trp 
290 295 300 

Tyr Asn Pro Glu Thr Asn Thr Tyr Ser Leu Glu Asp Ser Thr Pro His 
305 310 315 320 
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Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn lie Arg Gin Val 
325 330 335 

Phe Trp Trp Asp Asn Phe Asn Trp Ser lie Gly Phe Tyr Asn Thr Phe 
340 345 350 

Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
355 360 365 

Asn Thr Ser Tyr lie Gly Ser Glu lie Ser lie Thr Thr Arg His Ala 
370 375 380 

Gly Met He Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
385 390 395 400 

Ala Asp Ala He Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
405 410 415 



Gly Gly He His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
420 425 430 



s Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
435 440 445 



Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr Glu Ser He Leu Leu 
450 455 460 

Asn Phe Arg He Thr Tyr Tyr Gly Ala Arg He Asn Lys Gly Tyr Gin 
465 470 475 480 

Ala Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
485 490 495 

Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 
500 505 510 

Lys Phe * 
515 

(2) ANGABEN ZU SEQ ID NO: 77: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 912 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS048 

(ix) MERKMAL: 

(A) NAME / 3 CHLU3 5 E L : CDS 

(B) LAGE:1..912 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 77: 

ATG AAA AAG ATT. ATT CTT GCA TGC CTT ATG GCT TTT GTG GGT GCC AAT 4 8 

Met Lys Lys He He Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
520 525 530 
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Gi 



TTA AGC GCA GAG CCT AAG TGG TAT AGC AAG GCC TAC AAC AAA ACA AAC 96 
Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 
535 540 545 

ACC CAA AAA GGC TAT CTT TAT GGG AGT GGT TCA GCC ACT TCT AAA GAG 144 
Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 
550 555 560 

GCT TCT AAA CAA AAA GCG TTA GCG GAT TTA GTG GCG TCT ATT AGC GTG 192 
Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser lie Ser Val 
565 570 575 

GTG GTT AAT TCC CAA ATC CAT ATT CAA AAA AGT CGT GTG GAC AAT AAG 24 0 

Val Val Asn Ser Gin lie His lie Gin Lys Ser Arg Val Asp Asn Lys 
580 585 590 595 

TTA AAA TCC AGC GAT TCG CAA ACG ATT AAC TTA AAG ACC GAT GAC TTG 288 
Leu Lys Ser Ser Asp Ser Gin Thr lie Asn Leu Lys Thr Asp Asp Leu 
600 605 610 

GAA TTG AAT AAT GTA GAA ATT GTC AAT CAA GAA GTG CAA AAA GGG ATC 336 
*|lu Leu Asn Asn Val Glu lie Val Asn Gin Glu Val Gin Lys Gly lie 
615 620 625 

TAC TAC ACC AGA GTA AGG ATC AAT CAA AAC TTG TTT TTG CAG GGT TTA 384 
Tyr Tyr Thr Arg Val Arg He Asn Gin Asn Leu Phe Leu Gin Gly Leu 
630 635 640 

AGG GAT AAG TAT AAC GCT CTT TAT GGG CAG TTT TCC ACC TTA ATG CCT 432 
Arg Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
645 650 655 

AAG GTT TGT AAA GGG GTT TTT TTA CAG CAA TCC AAG AGC ATG GGG GAT 48 0 

Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
660 665 670 675 

TTA TTG GCT AAA GCG ATG CCT ATA GAA AGG ATT TTA AAA GCG TAT TCT 52 8 

Leu Leu Ala Lys Ala Met Pro lie Glu Arg lie Leu Lys Ala Tyr Ser 
680 685 690 

GTT CCG GTG GGT TCG TTA GAA AAT TAT GAA AAA ATC TAT TAT CAA AAC 576 
Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys He Tyr Tyr Gin Asn 
695 700 705 

T TTC AAA CCT AAA GTG CAA ATC ACT TTT GAT AAC AAC GGC GAT GCG 624 
a Phe Lys Pro Lys Val Gin He Thr Phe Asp Asn Asn Gly Asp Ala 
710 715 720 

GAA ATC AAA AGC GCT CTC ATA AGC GCT TAT GCC AGA GTG CTA ACC CCT 672 
Glu He Lys Ser Ala Leu He Ser Ala Tyr Ala Arg Val Leu Thr Pro 
725 730 735 

AGT GAT GAA GAA AAA CTC TAT CAA ATC AAA AAT GAA GTT TTC ACA GAC 72 0 

Ser Asp Glu Glu Lys Leu Tyr Gin He Lys Asn Glu Val Phe Thr Asp 
74 ° 745 750 755 

AGT GCT AAT GGC ATC ACG CGC ATT AGA GTG GTT GTT AGC GCG AGC GAT 768 
Ser Ala Asn Gly He Thr Arg He Arg Val Val Val Ser Ala Ser Asp 
760 765 770 

TGT CAA GGC ACG CCT GTA TTG AAT AGA AGC CTT GAA GTG GAT GAA AAG 816 
Cys Gin Gly Thr Pro Val Leu Asn Arg Ser Leu Glu Val Asp Glu Lys 
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775 780 785 

AAT AAG AAT TTT GCT ATC ACG CGC TTA CAA TCT TTG CTT TAT AAA GAA 864 
Asn Lys Asn Phe Ala He Thr Arg Leu Gin Ser Leu Leu Tyr Lys Glu 
790 795 800 

CTG AAA GAT TAT GCC AAT AAA GAA GGG CAA GGC AAT ACG GGG TTA TAA 912 
Leu Lys Asp Tyr Ala Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu * 
805 810 815 



(2) ANGABEN ZU SEQ ID NO: 78: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 304 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



# 



(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 78: 

[et Lys Lys He He Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
1 5 10 15 



Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 
20 25 30 

Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 
35 40 45 

Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser He Ser Val 
50 55 60 

Val Val Asn Ser Gin He His He Gin Lys Ser Arg Val Asp Asn Lys 
ss 70 75 80 

Leu Lys Ser Ser Asp Ser Gin Thr He Asn Leu Lys Thr Asp Asp Leu 
85 90 95 

Glu Leu Asn Asn Val Glu He Val Asn Gin Glu Val Gin Lys Gly He 
100 105 110 



Tyr Tyr Thr Arg Val Arg He Asn Gin Asn Leu Phe Leu Gin Gly Leu 
115 120 125 



irg Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
130 135 140 

Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
145 150 155 160 

Leu Leu Ala Lys Ala Met Pro He Glu Arg He Leu Lys Ala Tyr Ser 
165 170 175 

Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys He Tyr Tyr Gin Asn 
180 185 190 

Ala Phe Lys Pro Lys Val Gin He Thr Phe Asp Asn Asn Gly Asp Ala 
195 200 205 

Glu He Lys Ser Ala Leu He Ser Ala Tyr Ala Arg Val Leu Thr Pro 
210 215 220 
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Ser Asp Glu Glu Lys Leu Tyr Gin He Lys Asn Glu Val Phe Thr Asp 
225 230 235 240 

Ser Ala Asn Gly He Thr Arg He Arg Val Val Val Ser Ala Ser Asp 
245 250 255 

Cys Gin Gly Thr Pro Val Leu Asn Arg Ser Leu Glu Val Asp Glu Lys 
2 60 265 270 

Asn Lys Asn Phe Ala He Thr Arg Leu Gin Ser Leu Leu Tyr Lys Glu 
2 75 280 285 

Leu Lys Asp Tyr Ala Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu * 
290 295 300 

(2) ANGABEN ZU SEQ ID NO: 79: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 834 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS050 

(ix) MERKMAL: 

(A) NAME / S CHLUS S EL : CDS 

(B) LAGE:1..834 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 79: 

ATG AAA ACA AAC GGG CTT TTT AAA ATG TGG GGG CTG TTT TTA GTT TTA 48 
Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
305 310 315 320 

ATC GCT TTA GTC TTT AAT GCA TGT TCT GAT AGC CAT AAA GAA AAA AAG 96 
He Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
325 330 335 

pVC GCT TTA GAA GTC ATT AAA CAA AGA GGG GTT TTA AAA GTG GGG GTT 144 
.sp Ala Leu Glu Val He Lys Gin Arg Gly Val Leu Lys Val Gly Val 
340 345 350 

TTT AGC GAT AAG CCT CCT TTT GGC TCT GTG GAT TCT AAA GGG AAA TAT 192 
Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
355 360 365 

CAA GGC TAT GAT GTA GTT ATT GCT AAA CGC ATG GCT CTT GAT TTA TTG 24 0 

Gin Gly Tyr Asp Val Val He Ala Lys Arg Met Ala Leu Asp Leu Leu 
370 375 380 

GGC GAT GAA AAT AAG ATT GAG TTT ATT CCT GTA GAA GCT TCA GCT AGG 2 88 

Gly Asp Glu Asn Lys He Glu Phe He Pro Val Glu Ala Ser Ala Arg 
3 85 390 395 400 

GTG GAA TTT TTA AAA GCC AAT AAA GTG GAT ATT ATC ATG GCT AAT TTC 336 
Val Glu Phe Leu Lys Ala Asn Lys Val Asp He He Met Ala Asn Phe 
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405 410 415 

ACG CGC ACT AAA GAA AGA GAA AAA GTC GTG GAT TTC GCT AAG CCG TAT 3 84 

Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
420 425 430 

ATG AAA GTC GCT TTA GGG GTG GTT TCT AAA GAT GGG GTC ATT AAA AAT 432 
Met Lys Val Ala Leu Gly Val Val Ser Lys Asp Gly Val He Lys Asn 
435 440 445 

ATA GAA GAG TTG AAA GAT AAA GAG TTG ATT GTG AAT AAA GGC ACG ACA 4 80 

He Glu Glu Leu Lys Asp Lys Glu Leu He Val Asn Lys Gly Thr Thr 
450 455 460 

GCG GAT TTT TAT TTC ACT AAA AAT TAC CCC AAT ATC AAG CTT TTG AAA 52 8 

Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn He Lys Leu Leu Lys 
465 470 475 480 

TTT GAG CAA AAT ACA GAG ACT TTT TTA GCC CTT TTA AAC AAT AAG GCT 576 
Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
485 490 495 

CC GCT CTA GCC CAT GAC AAC ACT TTA TTG CTC GCT TGG ACG AAA CAA 624 
Thr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
500 505 510 

CAC CCT GAA TTT AAA TTA GGC ATT ACA AGC CTT GGC GAT AAG GAT GTG 672 
His Pro Glu Phe Lys Leu Gly He Thr Ser Leu Gly Asp Lys Asp Val 
515 520 525 

ATC GCT CCA GCG ATT AAA AAA GGC AAC CCC AAG CTT TTA GAA TGG TTG 72 0 

He Ala Pro Ala He Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
530 535 540 

AAT AAC GAA ATA GAT TCC CTC ATT TCT AGC GAC TTC TTA AAA GAA GCT 768 
Asn Asn Glu He Asp Ser Leu He Ser Ser Asp Phe Leu Lys Glu Ala 
545 550 555 560 

TAT CAA GAG ACT TTA GCA CCT GTT TAT GGC GAT GAA ATC AAA CCG GAA 816 
Tyr Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu He Lys Pro Glu 
565 570 575 

GAA ATT ATT TTT GAA TGA 834 
lu He He Phe Glu * 
580 

(2) ANGABEN ZU SEQ ID NO: 80: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 278 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 80: 

Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
1 5 10 15 

He Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
20 25 30 
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Asp Ala Leu Glu Val lie Lys Gin Arg Gly Val Leu Lys Val Gly Val 
35 40 45 

Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
50 55 60 

Gin Gly Tyr Asp Val Val He Ala Lys Arg Met Ala Leu Asp Leu Leu 
65 70 75 80 

Gly Asp Glu Asn Lys He Glu Phe He Pro Val Glu Ala Ser Ala Arg 
85 90 95 

Val Glu Phe Leu Lys Ala Asn Lys Val Asp He He Met Ala Asn Phe 
100 105 110 

Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
115 120 125 

Met Lys Val Ala Leu Gly Val Val Ser Lys Asp Gly Val He Lys Asn 
130 135 140 

le Glu Glu Leu Lys Asp Lys Glu Leu He Val Asn Lys Gly Thr Thr 
45 150 155 160 

Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn He Lys Leu Leu Lys 
165 170 175 

Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
180 185 190 

Thr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
195 200 205 

His Pro Glu Phe Lys Leu Gly He Thr Ser Leu Gly Asp Lys Asp Val 
210 215 220 

He Ala Pro Ala He Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
225 230 235 240 

Asn Asn Glu He Asp Ser Leu He Ser Ser Asp Phe Leu Lys Glu Ala 
245 250 255 

Tyr Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu He Lys Pro Glu 
260 265 270 

lu He He Phe Glu * 
275 

(2) ANGABEN ZU SEQ ID NO: 81: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1296 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) T0P0L0GIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS052 



(ix) MERKMAL: 



• 
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(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1296 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 81: 

GTG GCG TTA GCT GAA GAC GAT GGC TTT TAT ATG GGA GTG GGC TAT CAA 48 
Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
280 285 290 

ATC GGC GGC GCG CAA CAA AAT ATC GAT AAC AAA GGC AGC ACC CTA AGG 96 
lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
295 300 305 310 

AAT AAT GTC ATT AAT AAT TTC CGC CAA GTG GGC GTG GGT ATG GCA GGG 144 
Asn Asn Val lie Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
315 320 325 



•V 
T., 



GGT AAT GGG CTT TTA GCC TTA GCG ACA AAC ACG ACC ATG GAC GCT CTT 192 
Gly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
330 335 340 



TA GGG ATA GGC AAC CAA ATT GTC AAT ACT AAT ACA ACT GTT AGC AAC 24 0 

Leu Gly He Gly Asn Gin He Val Asn Thr Asn Thr Thr Val Ser Asn 
345 350 355 

AAC AAC GCA GAA TTA ACC CAG TTT AAA AAA ATA CTC CCT CAA ATT GAG 288 
Asn Asn Ala Glu Leu Thr Gin Phe Lys Lys He Leu Pro Gin He Glu 
360 365 370 

CAA CGC TTT GAA ACG AAT AAA AAC GCT TAT AGC GTT CAA GCC TTG CAA 336 
Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
375 380 385 390 

GTG TAT TTG AGT AAT GTG CTT TAT AAC TTG GTT AAT AAT AGT AAT AAT 3 84 

Val Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
395 400 405 

GGC AGT AAT AAT GGA GTC GTT CCT GAA TAT GTA GGA ATT ATA AAA GTT 432 
Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly He He Lys Val 
410 415 420 



CTC TAT GGT TCT CAA AAT GAA TTC AGT CTC TTA GCC ACG GAG AGT GTG 4 80 

eu Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
425 430 435 



GTG CTT TTA AAC GCG CTT ACA AGG GTG AAT CTG GAT AGT AAT TCG GTG 528 
Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
440 445 450 

TTT TTA AAA GGG CTA TTA GCC CAA ATG CAG CTT TTT AAT GAC ACT TCT 576 
Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
455 460 465 470 

TCA GCA AAG CTA GGC CAG ATC GCA GAA AAC TTG AAG AAC GGT GGT GCA 624 
Ser Ala Lys Leu Gly Gin He Ala Glu Asn Leu Lys Asn Gly Gly Ala 
475 480 485 

GGA TCA ATG CTC CAA AAG GAT GTG AAA ACC ATC TCG GAT CGA ATC GCT 672 
Gly Ser Met Leu Gin Lys Asp Val Lys Thr He Ser Asp Arg He Ala 
490 495 500 
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ACT TAC CAA GAG AAT CTA AAA CAG CTA GGA GGG ATG CTA AAG AAT TAC 720 
Tnr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 
505 510 515 

GAT GAA CCC TAC TTG CCC CAA TTT GGG CCA GGC ACA AGC TCT CAG CAT 768 
Asp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin His 
520 525 530 

GGG GTT ATT AAT GGC TTT GGC ATT CAA GTG GGC TAT AAG CAA TTT TTT 816 
Gly Val lie Asn Gly Phe Gly He Gin Val Gly Tyr Lys Gin Phe Phe 
535 540 545 550 

GGG AAC AAG CGG AAT ATA GGC TTA CGA TAT TAC GCT TTC TTT GAT TAT 864 
Gly Asn Lys Arg Asn He Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
555 560 565 

GGC TTT ACG CAA TTG GGC AGT CTT AGC AGC GCC GTT AAA GCG AAT ATC 912 
Gly Phe Thr Gin Leu Gly Ser Leu Ser Ser Ala Val Lys Ala Asn He 
570 575 580 

TTT ACT TAT GGC GCT GGC ACG GAC TTT TTA TGG AAT ATC TTT AGA AGG 960 
fc he Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn He Phe Arg Arg 
585 590 595 

GTT TTT AGC GAT CAG TCC TTG AAT GTG GGG GTG TTT GGG GGC ATT CAA 10 0 8 

Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly He Gin 
600 60S 610 

ATA GCG GGT AAC ACT TGG GAT AGC TCT TTA AGA GGT CAA ATT GAA AAC 1056 
He Ala Gly Asn Thr Trp Asp Ser Ser Leu Arg Gly Gin He Glu Asn 
615 620 625 630 

TCG TTT AAA GAA TAC CCC ACT CCC ACG AAT TTC CAA TTT TTG TTT AAT 1104 
Ser Phe Lys Glu Tyr Pro Thr Pro Thr Asn Phe Gin Phe Leu Phe Asn 
635 640 645 

TTG GGT TTA AGG GCT CAT TTT GCC AGC ACC ATG CAC CGC CGG TTT TTG 1152 
Leu Gly Leu Arg Ala His Phe Ala Ser Thr Met His Arg Arg Phe Leu 
650 655 660 

AGC GCG TCT CAA AGC ATT CAG CAT GGG ATG GAA TTT GGC GTG AAA ATC 1200 
Ser Ala Ser Gin Ser He Gin His Gly Met Glu Phe Gly Val Lys He 
665 670 675 

:G GCT ATC AAT CAA AGG TAT TTG AGG GCC AAT GGG GCT GAT GTG GAT 124 8 

o Ala He Asn Gin Arg Tyr Leu Arg Ala Asn Gly Ala Asp Val Asp 
680 685 690 



TAC AGG CGT TTG TAT GCG TTC TAT ATC AAT TAC ACG ATA GGT TTT TAA 12 96 

Tyr Arg Arg Leu Tyr Ala Phe Tyr He Asn Tyr Thr He Gly Phe * 
695 700 705 710 



(2) ANGABEN ZU SEQ ID NO: 82: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 432 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS: Protein 

<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 82: 



• 
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Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
1 5 10 15 

lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
20 25 30 

Asn Asn Val lie Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
35 40 45 

Gly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
50 55 60 

Leu Gly lie Gly Asn Gin lie Val Asn Thr Asn Thr Thr Val Ser Asn 
65 70 75 80 

Asn Asn Ala Glu Leu Thr Gin Phe Lys Lys lie Leu Pro Gin lie Glu 
85 90 95 

Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
100 105 110 

fal Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
115 120 125 

Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly lie He Lys Val 
130 135 140 

Leu Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
145 150 155 160 

Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
165 170 175 

Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
180 185 190 

Ser Ala Lys Leu Gly Gin He Ala Glu Asn Leu Lys Asn Gly Gly Ala 
195 200 205 

Gly Ser Met Leu Gin Lys Asp Val Lys Thr lie Ser Asp Arg He Ala 
210 215 220 

Thr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 



Hsp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin His 
W 245 250 255 

Gly Val He Asn Gly Phe Gly He Gin Val Gly Tyr Lys Gin Phe Phe 
260 265 270 

Gly Asn Lys Arg Asn He Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
275 280 285 

Gly Phe Thr Gin Leu Gly Ser Leu Ser Ser Ala Val Lys Ala Asn He 
290 295 300 

Phe Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn He Phe Arg Arg 
305 310 315 320 

Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly He Gin 




230 



235 



240 



325 



330 



335 
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lie Ala Gly Asn Thr Trp Asp Ser Ser Leu Arg Gly Gin lie Glu Asn 
340 345 350 

Ser Phe Lys Glu Tyr Pro Thr Pro Thr Asn Phe Gin Phe Leu Phe Asn 
355 360 365 

Leu Gly Leu Arg Ala His Phe Ala Ser Thr Met His Arg Arg Phe Leu 
370 375 380 

Ser Ala Ser Gin Ser lie Gin His Gly Met Glu Phe Gly Val Lys lie 
385 390 395 400 

Pro Ala lie Asn Gin Arg Tyr Leu Arg Ala Asn Gly Ala Asp Val Asp 
405 410 415 

Tyr Arg Arg Leu Tyr Ala Phe Tyr lie Asn Tyr Thr lie Gly Phe * 
420 425 430 



^^(2) ANGABEN ZU SEQ ID NO: 83: 

(i) SEQUENZKENNZEICHEN : 
^^^F (A) LANGE : 1197 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS056 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1197 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 83: 

ATG GAA TCA GTA AAA ACA GGA AAA ACA AAT AAG GTT GGC AAG AAT ACA 4 8 

Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
435 440 445 

AG ATG GCT AAT ACA AAG GCA AAT AAA GAG ACT CAT TTT AAA CAA GTG 96 
lu Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
450 455 460 

AGC GCC ATT ACA AAT ATA ATC AGA TCA GTT GGT GGG TTT TTT ACA AAA 144 
Ser Ala lie Thr Asn lie lie Arg Ser Val Gly Gly Phe Phe Thr Lys 
465 470 475 480 

ATT GCA AAG AGA GTT AGA GGA CTT GTA AAA AAA CAC CCC AAG AAA AGC 192 
lie Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
485 490 495 

AGT GCG GCA TTA GTA GTA TTG ACC CAT ATT GCG TGC AAG AAA GCG AAA 240 
Ser Ala Ala Leu Val Val Leu Thr His lie Ala Cys Lys Lys Ala Lys 
500 505 510 

GAA TTA GAC GAT AAA GTC CAA GAT AAA TCC AAA CAA GCT GAA AAA GAA 288 
Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
515 520 525 
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AAT CAA ATC AAT TGG TGG AAA TAT TCA GGA TTA ACA ATA GCG GCA AGT 336 
Asn Gin lie Asn Trp Trp Lys Tyr Ser Gly Leu Thr lie Ala Ala Ser 
530 535 540 

TTA TTA TTA GCC GCT TGT AGC GCT GGT GAT ACT GAT AAA CAG ATA GAA 3 84 

Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin lie Glu 
545 550 555 560 

CTA GAA CAA GAA AAA AAG GAA GCT GAA AAC GCT AGG GAT AGA GCG AAC 432 
Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 
565 570 575 

AAG AGT GGG ATA GAA CTA GAA CAA GAA AGA CAG AAA ACA AAC AAG AGT 480 
Lys Ser Gly lie Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 
580 585 590 

GGG ATA GAA CTC GCT AAT AGT CAA ATA AAA GCA GAA CAA GAA AGA CAA 52 8 

Gly lie Glu Leu Ala Asn Ser Gin lie Lys Ala Glu Gin Glu Arg Gin 
595 600 605 



G ACA GAA CAA GAA AAA CAA AAA GCA AAT AAG AGT GCG ATA GAG TTA 576 
s Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala lie Glu Leu 
610 615 620 



GAA CAG CAA AAA CAA AAG ACC ATT AAT ACA CAA AGA GAT TTG ATT AAA 624 
Glu Gin Gin Lys Gin Lys Thr lie Asn Thr Gin Arg Asp Leu lie Lys 
625 630 635 640 

GAA CAG AAA GAT TTC ATT AAA GAA ACA GAA CAA AAT TGC CAA GAA AAT 672 
Glu Gin Lys Asp Phe lie Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
645 650 655 

CAT AAT CAA TTC TTT ATT AAA AAA TTA GGA ATT AAG GGT GGC ATT GCT 720 
His Asn Gin Phe Phe lie Lys Lys Leu Gly lie Lys Gly Gly lie Ala 
660 665 670 

ATA GAA GTA GAA GCT GAA TGC AAA ACC CCT AAA CCT GCA AAA ACC AAT 768 
lie Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
675 680 685 

CAA ACC CCT ATC CAG CCA AAA CAC CTC CCA AAC TCT AAA CAA CCT CAT 816 
Gin Thr Pro lie Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
690 695 700 



T CAA AGA GGA TCA AAA GCG CAA GAG TTT ATC GCT TAT TTG CAA AAA 864 
er Gin Arg Gly Ser Lys Ala Gin Glu Phe lie Ala Tyr Leu Gin Lys 
705 710 715 720 

GAG CTA GAA TTT CTG CCC TAT TCG CAA AAA GCT ATC GCT AAA CAA GTG 912 
Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala He Ala Lys Gin Val 
725 730 735 

AAT TTC TAT AAA CCA AGT TCT ATC GCT TAT TTA GAA CTA GAT CCT AGA 960 
Asn Phe Tyr Lys Pro Ser Ser He Ala Tyr Leu Glu Leu Asp Pro Arg 
740 745 750 

GAT TTT AAG GTT ACA GAA GAA TGG CAA AAA GAA AAT CTA AAA ATA CGC 1008 
Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys He Arg 
755 760 765 

TCT AAA GCT CAA GCT AAA ATG CTT GAA ATG AGG GAT TTA AAA CCA GAC 1056 
Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 
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770 775 780 

CCA CAA GCC CAC CTT CCA ACC TCT CAA AGC CTT TTG TTC GTT CAA AAA 1104 
Pro Gin Ala His Leu Pro Thr Ser Gin Ser Leu Leu Phe Val Gin Lys 
7Q 5 790 795 800 

ATA TTT GCT GAT GTT AAT AAA GAA ATA GAA GCA GTT GCT AAT ACT GAA 1152 
lie Phe Ala Asp Val Asn Lys Glu lie Glu Ala Val Ala Asn Thr Glu 
805 810 815 

AAG AAA GCA GAA AAA GCG GGT TAT GGT TAT AGT AAA AGG ATG TAG 1197 
Lys Lys Ala Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met * 
820 825 830 



(2) ANGABEN ZU SEQ ID NO: 84: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 3 99 Aminosauren 

(B) ART: Aminosaure 
<D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 84: 

Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
1 5 10 15 

Glu Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
20 25 30 

Ser Ala lie Thr Asn lie lie Arg Ser Val Gly Gly Phe Phe Thr Lys 
35 40 45 

lie Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
50 55 60 

Ser Ala Ala Leu Val Val Leu Thr His lie Ala Cys Lys Lys Ala Lys 
65 70 75 80 

Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
85 90 95 

sn Gin lie Asn Trp Trp Lys Tyr Ser Gly Leu Thr He Ala Ala Ser 
100 105 110 

Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin He Glu 
115 120 125 

Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 
130 135 X40 

Lys Ser Gly He Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 
145 150 155 160 

Gly lie Glu Leu Ala Asn Ser Gin He Lys Ala Glu Gin Glu Arg Gin 
165 170 175 

Lys Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala He Glu Leu 
180 185 190 

Glu Gin Gin Lys Gin Lys Thr He Asn Thr Gin Arg Asp Leu He Lys 




131 

195 200 205 

Glu Gin Lys Asp Phe lie Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
210 215 220 

His Asn Gin Phe Phe lie Lys Lys Leu Gly lie Lys Gly Gly lie Ala 
225 230 235 240 

lie Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
245 250 255 

Gin Thr Pro lie Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
260 265 270 

Ser Gin Arg Gly Ser Lys Ala Gin Glu Phe lie Ala Tyr Leu Gin Lys 
275 280 285 

Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala lie Ala Lys Gin Val 
290 295 300 

Asn Phe Tyr Lys Pro Ser Ser lie Ala Tyr Leu Glu Leu Asp Pro Arg 
05 310 315 320 

Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys lie Arg 
325 330 335 

Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 
340 345 350 

Pro Gin Ala His Leu Pro Thr Ser Gin Ser Leu Leu Phe Val Gin Lys 
355 360 365 

lie Phe Ala Asp Val Asn Lys Glu lie Glu Ala Val Ala Asn Thr Glu 
370 375 380 

Lys Lys Ala Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met * 
385 390 395 

(2) ANGABEN ZU SEQ ID NO: 85: 

( i ) SEQTJENZ KENNZ E I CHEN : 

(A) LANGE: 1131 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS059 

<ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1131 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 85: 

ATG AAT TTT TTT AAA ATC CTT TTA ATG GAA TTA AGA GCC ATT GTT TCT 4 8 

Met Asn Phe Phe Lys lie Leu Leu Met Glu Leu Arg Ala lie Val Ser 
400 405 410 415 
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CAT AAA GGC GTT TTA TTA ATC CTT ATA GGC GCT CCT TTA ATC TAT GGC 96 
His Lys Gly Val Leu Leu lie Leu lie Gly Ala Pro Leu lie Tyr Gly 
420 425 430 

TTA TTA TAC CCT TTG CCT TAT TTA AGA GAC ATC GTA ACG CAG CAA AAA 144 
Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp lie Val Thr Gin Gin Lys 
435 440 445 

ATC GCC CTT GTA GAT GAA GAC AAT TCC TTC CTT TCT AGG CAA TTA GCC 192 
lie Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
450 455 460 

TTC ATG GCG CAA AGC TCC AAC GAG TTA GAA ATC GCT TTT TTT AGC CCC 24 0 

Phe Met Ala Gin Ser Ser Asn Glu Leu Glu lie Ala Phe Phe Ser Pro 
465 470 475 

TCT ATG CTG GAA GCC AAA AAG CTT TTA AAA GAA GAA AAA ATT TAT GGG 288 
Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys lie Tyr Gly 
480 485 490 495 

TC TTG CAC ATT CCC TCT CAT TTT GAA GCC AAT ATC CAT AAA CAA GTG 3 36 

le Leu His lie Pro Ser His Phe Glu Ala Asn lie His Lys Gin Val 
500 505 510 

CCT GTA ACG ATA GAT TTT TAT GCG AAT TCC AAT TAC TTT TTG ATT TAT 384 
Pro Val Thr lie Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu lie Tyr 
■ 515 520 525 

GGT GCG TTA GCG AAT GCG GTG GTG GAG AGC ATC AAC GCT TTA AAT GAT 432 
Gly Ala Leu Ala Asn Ala Val Val Glu Ser lie Asn Ala Leu Asn Asp 
530 535 540 

GAG ATA AGG TTC AAA CGC AAT GCC CAA ATA GAA GAA GCT GAA TTA GGG 480 
Glu lie Arg Phe Lys Arg Asn Ala Gin lie Glu Glu Ala Glu Leu Gly 
545 550 555 

ACA GAC GGG ATT AAA ATC AGG CCT ATC GCT TTA TAT AAC CCT AGT GAG 528 
Thr Asp Gly lie Lys lie Arg Pro lie Ala Leu Tyr Asn Pro Ser Glu 
560 565 570 575 

GGG TAT TTG AAT TAC GCG CTC TCT AGC GTG TTT ATT TTC ATT TTG CAC 576 
Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe lie Phe lie Leu His 
580 585 590 



G GTG ATG CTC ATT GCA AGC AGC ATG TTT ACT AGC TCC AGG CGT TTG 624 
In Val Met Leu lie Ala Ser Ser Met Phe Thr Ser Ser Arg Arg Leu 
595 600 605 

GAA TTA GCC CTT TTA GAC AGA AAG CAA ATC GCT TTA AGG CTG TGC ACA 672 
Glu Leu Ala Leu Leu Asp Arg Lys Gin lie Ala Leu Arg Leu Cys Thr 
610 615 620 

AGA CTT TTG GTG TTC ATG GGG GCG TTT AGC GTT TTT ATT TTA TGG TAT 720 
Arg Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe lie Leu Trp Tyr 
625 630 635 

TTT GGG GCG CTG TTT TCT TTT TAT GGG ATC GAA CGG CAT GGG AGC GCT 768 
Phe Gly Ala Leu Phe Ser Phe Tyr Gly lie Glu Arg His Gly Ser Ala 
640 645 650 655 

TTA ATG GTG TTT TTG AAT AGT TTG ATT TTC ATG CTT GCA ACC TTG AGT 816 
Leu Met Val Phe Leu Asn Ser Leu lie Phe Met Leu Ala Thr Leu Ser 
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660 665 670 

TTG GGG TCG TTT TTA GGC GCA TGG ATT AAA AAT GAA GCC CAC ACC ACT 8 64 

Leu Gly Ser Phe Leu Gly Ala Trp lie Lys Asn Glu Ala His Thr Thr 
675 680 685 

CAA ATC GTT TTA ATT TCT TCT TTG CCC TTG ATT TTT ATG ATG GGT TTT 912 
Gin lie Val Leu lie Ser Ser Leu Pro Leu lie Phe Met Met Gly Phe 
690 695 700 

GTG TGG CCT TTT GAA TCC TTG CCC TCT TAT TTA CAG GTT TTT GTT CAA 960 
Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
705 710 715 

ATA GTG CCA GCT TAT CAT GGG ATC AGT TTG CTA GGG CGA TTG AAT CAA 1008 
lie Val Pro Ala Tyr His Gly lie Ser Leu Leu Gly Arg Leu Asn Gin 
720 725 730 735 

ATG CAT GCG GAA TTT ATA GAT GTT TCC TTC CAT TTT TAT GCG CTT ATT 1056 
Met His Ala Glu Phe He Asp Val Ser Phe His Phe Tyr Ala Leu He 
740 745 750 

CG ATT TTT ATT GCG AGT TTT ATA GGG AGT GTC TTT AAA CTC AGC TCT 1104 
r Ala He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser 
755 760 765 

TTA AAG AAA GCT TGT GAA AAC GCT TAA 1131 
Leu Lys Lys Ala Cys Glu Asn Ala * 
770 775 

(2) ANGABEN ZU SEQ ID NO: 86: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 377 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 86: 

Met Asn Phe Phe Lys He Leu Leu Met Glu Leu Arg Ala He Val Ser 
15 10 15 

s Lys Gly Val Leu Leu He Leu He Gly Ala Pro Leu He Tyr Gly 
20 25 30 

Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp He Val Thr Gin Gin Lys 
35 40 45 

He Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
50 55 60 

Phe Met Ala Gin Ser Ser Asn Glu Leu Glu He Ala Phe Phe Ser Pro 
65 70 75 80 

Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys He Tyr Gly 
85 90 95 

He Leu His He Pro Ser His Phe Glu Ala Asn He His Lys Gin Val 
100 105 110 



Pro Val Thr lie Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu lie Tyr 
115 120 125 

Gly Ala Leu Ala Asn Ala Val Val Glu Ser He Asn Ala Leu Asn Asp 
130 135 140 

Glu He Arg Phe Lys Arg Asn Ala Gin He Glu Glu Ala Glu Leu Gly 
145 150 155 160 

Thr Asp Gly He Lys He Arg Pro He Ala Leu Tyr Asn Pro Ser Glu 
165 170 175 

Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe He Phe He Leu His 
180 185 190 

Gin Val Met Leu He Ala Ser Ser Met Phe Thr Ser Ser Arg Arg Leu 
195 200 205 



Glu Leu Ala Leu Leu Asp Arg Lys Gin He Ala Leu Arg Leu Cys Thr 
210 215 220 



rg Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe He Leu Trp Tyr 
25 230 235 240 




Phe Gly Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Gly Ser Ala 
245 250 255 

Leu Met Val Phe Leu Asn Ser Leu He Phe Met Leu Ala Thr Leu Ser 
260 265 270 

Leu Gly Ser Phe Leu Gly Ala Trp He Lys Asn Glu Ala His Thr Thr 
275 280 285 

Gin He Val Leu He Ser Ser Leu Pro Leu He Phe Met Met Gly Phe 
290 295 300 

Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
305 310 315 320 

He Val Pro Ala Tyr His Gly He Ser Leu Leu Gly Arg Leu Asn Gin 
325 330 335 

Met His Ala Glu Phe He Asp Val Ser Phe His Phe Tyr Ala Leu He 
340 345 350 

la He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser 
355 360 365 

Leu Lys Lys Ala Cys Glu Asn Ala * 
370 375 

(2) ANGABEN ZU SEQ ID NO: 87: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 516 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 




135 



(B) CLON(E) : HPS063 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..516 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 87: 

ATG TTT GTA GTT AAA ATG GTG TTA GGG TTT TTG ATC CTT TTA AGC CCT 4 8 

Met Phe Val Val Lys Met Val Leu Gly Phe Leu lie Leu Leu Ser Pro 
380 385 390 

TTG TGC GCT ACT GGA TTG GAT ATT TCA CAA ACA GAT ATT ATA GAG CGT 96 
Leu Cys Ala Thr Gly Leu Asp lie Ser Gin Thr Asp lie lie Glu Arg 
395 400 405 

TCT TTA AAT TTC CTT TTA TTT GTG GGG ATT TTG TGG TAT TTT TCG GCT 144 
Ser Leu Asn Phe Leu Leu Phe Val Gly lie Leu Trp Tyr Phe Ser Ala 
410 415 420 425 



AAA CTG CGT TCA TTT TTA CGC TCC AAA AGT CTT GAA ATC TCC AAA 192 
ys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu lie Ser Lys 
430 435 440 




CGC TTA GAA GAG ATT CAA GCC CAA CTC AAA GTG AGT AAA GAA AAT AAG 24 0 

Arg Leu Glu Glu lie Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
445 450 455 

AAA AAA CTC TTA AAA GAA TTA GAG CAA GCC AAA GAA AAA GCG GAA TTG 288 
Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
460 465 470 

ATT GTT TCT GAT GCG AAT AAA GAA GCT TAC ATG ATC ACG CAA AAA TAC 3 36 

lie Val Ser Asp Ala Asn Lys Glu Ala Tyr Met lie Thr Gin Lys Tyr 
475 480 485 

GAA TTG CAA ACC AAA ATG GAT GTG GAA AAT TTG ATC AAA AAT TCT AAG 3 84 

Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu lie Lys Asn Ser Lys 
490 495 500 505 

GCG TTG ATG GAT TTA GAA GTT AAA AAG ATC AAA AGA GAG CTG GTT GAA 432 
Ala Leu Met Asp Leu Glu Val Lys Lys lie Lys Arg Glu Leu Val Glu 
510 515 520 

GC GTT TTT AAA QAT CTA AGA GAQ AGC AAA GTC TCX XTC AAT GCG 4 80 

Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
525 530 535 

CAA GAT TGC GTG AAT ATT TTG AAA CAA AGG CTT TAA 516 
Gin Asp Cys Val Asn lie Leu Lys Gin Arg Leu * 
540 545 



(2) ANGABEN ZU SEQ ID NO: 88: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 172 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 



(ii) ART DES MOLEKULS : Protein 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 88: 

Met Phe Val Val Lys Met Val Leu Gly Phe Leu lie Leu Leu Ser Pro 
15 10 15 

Leu Cys Ala Thr Gly Leu Asp lie Ser Gin Thr Asp lie lie Glu Arg 
20 25 30 

Ser Leu Asn Phe Leu Leu Phe Val Gly lie Leu Trp Tyr Phe Ser Ala 
35 40 45 

Lys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu lie Ser Lys 
50 55 60 

Arg Leu Glu Glu lie Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
65 70 75 80 

Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
85 90 95 

le Val Ser Asp Ala Asn Lys Glu Ala Tyr Met lie Thr Gin Lys Tyr 
100 105 110 

Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu lie Lys Asn Ser Lys 
115 120 125 

Ala Leu Met Asp Leu Glu Val Lys Lys lie Lys Arg Glu Leu Val Glu 
130 135 140 

Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
145 150 155 160 

Gin Asp Cys Val Asn lie Leu Lys Gin Arg Leu * 
165 170 

(2) ANGABEN ZU SEQ ID NO: 89: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 990 Basenpaare 

(B) ART : Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS069 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 89: 

ATG TCA AAT AGC ATG TTG GAT AAA AAT AAA GCG ATT CTT ACA GGG GGT 4 8 

Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala lie Leu Thr Gly Gly 
175 180 185 

GGG GCT TTA TTG TTA GGG CTA ATC GTG CTT TTT TAT TTG GCT TAT CGC 96 
Gly Ala Leu Leu Leu Gly Leu lie Val Leu Phe Tyr Leu Ala Tyr Arg 
190 195 200 
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CCT AAG GCT GAA GTG TTG CAA GGA TTT TTG GAA GCC AGA GAA TAC AGC 144 
Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
205 210 215 220 

GTG AGT TCC AAA GTC CCT GGC CGC ATT GAA AAG GTG TTT GTT AAA AAA 192 
Val Ser Ser Lys Val Pro Gly Arg lie Glu Lys Val Phe Val Lys Lys 
225 230 235 

GGC GAT CGC ATT AAA AAG GGC GAT TTG GTT TTT AGC ATT TCT AGC CCT 240 
Gly Asp Arg lie Lys Lys Gly Asp Leu Val Phe Ser lie Ser Ser Pro 
240 245 250 

GAA TTA GAA GCC AAG CTC GCT CAA GCT GAA GCC GGG CAT AAA GCC GCT 288 
Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 
255 260 265 

AAA GCG CTT AGC GAT GAA GTC AAA AGA GGC TCA AGA GAC GAA ACG ATC 33 6 

Lys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr lie 
270 275 280 

T TCT GCA AGA GAC GTT TQG CAA QCG GCC AAA TCT CAA GCC ACT TTA 3Q4 

fe>sn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
mQS 290 295 300 

GCC AAA GAG ACT TAT AAG CGC GTT CAA GAT TTG TAT. GAT AAT GGC GTG 432 
Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
305 310 315 

GCG AGC TTG CAA AAG CGC GAT GAA GCC TAT GCG GCT TAT GAA AGC ACT 480 
Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
320 325 330 

AAA TAC AAC GAG AGC GCG GCT TAC CAA AAG TAT AAA ATG GCT TTA GGG 52 8 

Lys Tyr Asn Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
335 340 345 

GGG GCG AGC TCT GAA AGT AAG ATT GCC GCT AAG GCT AAA GAG AGC GCG 576 
Gly Ala Ser Ser Glu Ser Lys lie Ala Ala Lys Ala Lys Glu Ser Ala 
350 355 360 

GCT TTA GGG CAA GTG AAT GAA GTG GAG TCT TAT TTA AAA GAT GTC AAA 624 
Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
365 370 375 380 

CG ACA GCC CCA ATT GAT GGG GAA GTG AGT AAT GTG CTT TTA AGC GGT 672 
la Thr Ala Pro lie Asp Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
385 390 395 

GGC GAG CTT AGC CCT AAG GGC TTT CCT GTG GTG CTC ATG ATT GAT TTA 720 
Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met lie Asp Leu 
400 405 410 

AAG GAT AGT TGG TTA AAA ATC AGC GTG CCT GAA AAG TAT TTG AAC GAT 7 68 

Lys Asp Ser Trp Leu Lys lie Ser Val Pro Glu Lys Tyr Leu Asn Asp 
415 420 425 

TTT AAA GTG GGT AAG GAA TTT GAA GGT TAT ATC CCG GCG TTG AAA AGA 816 
Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr He Pro Ala Leu Lys Arg 
430 435 440 

AGC GCG AAA TTC AGG GTC AAA TAT TTG AGC GTG ATG GGG GAT TTT GCG 864 
Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
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445 450 455 460 

ACT TGG AAA GCG ACG AAT AAT TCC AAC ACT TAC GAC ATG AAA AGC TAT 912 
Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
465 470 475 

GAA GTG GAG GCC ATA CCC TTA GAA GAG TTG GAA AAT TTT AGG GTA GGG 960 
Glu Val Glu Ala lie Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
480 485 490 

ATG AGC GTG TTA GTT ACC ATT AAA CCT TAA 990 
Met Ser Val Leu Val Thr lie Lys Pro * 
495 500 

(2) ANGABEN ZU SEQ ID NO: 90: 

( i ) S E QUENZ KENNZEI CHEN : 

(A) LANGE: 330 Aminosauren 

( B ) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 90: 

Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala lie Leu Thr Gly Gly 
15 10 15 

Gly Ala Leu Leu Leu Gly Leu lie Val Leu Phe Tyr Leu Ala Tyr Arg 
20 25 30 

Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
35 40 45 

Val Ser Ser Lys Val Pro Gly Arg lie Glu Lys Val Phe Val Lys Lys 
50 55 60 

Gly Asp Arg lie Lys Lys Gly Asp Leu Val Phe Ser lie Ser Ser Pro 
65 70 75 80 

Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 

85 90 95 

ys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr lie 
100 105 110 

sn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
115 120 125 

Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
130 135 140 

Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
145 150 155 160 

Lys Tyr Asn Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
165 170 175 

Gly Ala Ser Ser Glu Ser Lys lie Ala Ala Lys Ala Lys Glu Ser Ala 
180 185 190 

Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
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195 200 205 

Ala Thr Ala Pro lie Asp Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
210 215 220 

Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met lie Asp Leu 
225 230 235 240 

Lys Asp Ser Trp Leu Lys lie Ser Val Pro Glu Lys Tyr Leu Asn Asp 
245 250 255 

Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr lie Pro Ala Leu Lys Arg 
260 265 270 

Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
275 280 285 

Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
290 295 300 



lu Val Glu Ala lie Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
'5 310 315 320 




et Ser Val Leu Val Thr lie Lys Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 91: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 684 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE : linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS091 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..684 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 91: 

ATG GTA TTT GAC AGA ACA ATC AGC GTA AGA GAA AAA AAA GCG GCT AAA 4 8 

Met Val Phe Asp Arg Thr lie Ser Val Arg Glu Lys Lys Ala Ala Lys 
335 340 345 

ACG CTT GGG ATT ATT GGG ATC GTC TTT TTT ATT TTG TTT GGC ATC GTG 96 
Thr Leu Gly lie lie Gly lie Val Phe Phe lie Leu Phe Gly lie Val 
350 355 360 

ATA AGC GGG GTG GCT TTT CAA AAA GAG TGG GTG CAA CAA TTG GAT TTA 144 
lie Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 
365 370 375 

TTT TTT ATA GAC TTG ATC CGC AAC CCT GCC CCC ATT CAA AAA AGC GCG 192 
Phe Phe lie Asp Leu lie Arg Asn Pro Ala Pro lie Gin Lys Ser Ala 
380 385 390 
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TGG CTT TCT TTC GTG TTT TTT AGC ACT TGG TTT GCA CAA AGC AAG CTC 240 
Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
395 400 405 410 

ACC ACT CCT ATA GCC TTA CTC ATT GGC TTG TGG TTT GGG TTT CAA AAA 2 88 

Thr Thr Pro lie Ala Leu Leu lie Gly Leu Trp Phe Gly Phe Gin Lys 
415 420 425 

CGC ATC GCT TTG GGG GTG TGG TTT TTC TTT AGC ATC TTA TTA GGT GAA 33 6 

Arg lie Ala Leu Gly Val Trp Phe Phe Phe Ser lie Leu Leu Gly Glu 
430 435 440 

TTC ACC TTA AAA TCC CTT AAG CTT TTA GTG GCG CGC CCA CGG CCT GTA 3 84 

Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
445 450 455 

ACC AAT GGC GAA TTG GTT TTC GCG CAT GGC TTT AGT TTC CCT AGC GGG 432 
Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
460 465 470 

CAT GCT TTG GCT TCA GCG CTT TTT TAC GGC TCT TTG GCG TTG TTG TTA 4 80 

^~is Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
7 5 480 485 490 

TGC TAT TCT AAC GCC AAC AAT CGC ATT AAA ACG ATT ATT GCT GTG GTT 528 
Cys Tyr Ser Asn Ala Asn Asn Arg lie Lys Thr lie lie Ala Val Val 
495 500 505 

TTG CTT TTT TGG ATT TTT TTA ATG GCG TAT GAT AGG GTT TAT TTA GGG 576 
Leu Leu Phe Trp lie Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
510 515 520 

GTG CAT TAC CCT AGC GAT GTT TTA GGA GGG TTT TTA TTA GGG ATT GCT 624 
Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly lie Ala 
525 530 535 

TGG TCG TGC TGC TCT TTA GCG CTT TAT TTA GGG TTT TTG AAA CGC CCT 672 
Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
540 545 550 

TAT AAT CAA TAA 684 

Tyr Asn Gin * 

555 



2) ANGABEN ZU SEQ ID NO: 92: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 228 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 92: 

Met Val Phe Asp Arg Thr lie Ser Val Arg Glu Lys Lys Ala Ala Lys 
15 10 15 

Thr Leu Gly He He Gly He Val Phe Phe He Leu Phe Gly He Val 
20 25 30 

He Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 
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35 40 45 

Phe Phe lie Asp Leu He Arg Asn Pro Ala Pro He Gin Lys Ser Ala 
50 55 60 

Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
65 70 75 80 

Thr Thr Pro He Ala Leu Leu He Gly Leu Trp Phe Gly Phe Gin Lys 
85 90 95 

Arg He Ala Leu Gly Val Trp Phe Phe Phe Ser He Leu Leu Gly Glu 
100 105 110 

Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
115 120 125 

Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
130 135 140 

is Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
,45 150 155 160 

fcys Tyr Ser Asn Ala Asn Asn Arg He Lys Thr He He Ala Val Val 
165 170 175 

Leu Leu Phe Trp He Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
180 185 190 

Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly He Ala 
195 200 205 

Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
210 215 220 

Tyr Asn Gin * 
225 

(2) ANGABEN ZU SEQ ID NO: 93: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 729 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS095 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1 . .729 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 93: 



ATG AAA AAA ATT TTT TCT CAA TCT TTG TTA GCT TTG GTT GTT TCT GTC 
Met Lys Lys He Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
230 235 240 



48 



\ 
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AAT GCG CTA CTA GCT ATG GAT GGT AAT GGC GTG TTT ATA GGG GCG GGT 96 
Asn Ala Leu Leu Ala Met Asp Gly Asn Gly Val Phe lie Gly Ala Gly 
245 250 255 260 

TAT TTG CAA GGA CAA GCC CAA ATG CAT GCG GAT ATT AAT TCT CAA AAA 144 
Tyr Leu Gin Gly Gin Ala Gin Met His Ala Asp He Asn Ser Gin Lys 
265 270 275 

CAA GCC ACT AGC GCT ACT ATC AAG GGG TTT GAT GCG CTT TTA GGG TAT 192 
Gin Ala Thr Ser Ala Thr He Lys Gly Phe Asp Ala Leu Leu Gly Tyr 
280 285 290 

CAG TTT TTC TTT GGG AAA TAC TTT GGC TTA CGC CTT TAT GGG TTT TTT 240 
Gin Phe Phe Phe Gly Lys Tyr Phe Gly Leu Arg Leu Tyr Gly Phe Phe 
295 300 305 

GAC TAC GCC CAT GCC AAT TCT ATT AGG CTT AAA AAC CCT AAT TAT AAC 288 
Asp Tyr Ala His Ala Asn Ser He Arg Leu Lys Asn Pro Asn Tyr Asn 
310 315 320 



C GAA GTG GTG CAA TTG GCG GGT CAA GTT CTT GGG AAA CAA GAA ATC 336 
n Glu Val Val Gin Leu Ala Gly Gin Val Leu Gly Lys Gin Glu He 
5 330 335 340 



AAT CGT TTA ACG AGC CTT GCT GAT CCC AAA ACC TTT GAG CCA AAC ATG 3 84 

Asn Arg Leu Thr Ser Leu Ala Asp Pro Lys Thr Phe Glu Pro Asn Met 
345 350 355 

CTC ACT TAT GGG GGG GCT ATG GAT GTG ATG GTT AAT GTC ATT AAT AAT 432 
Leu Thr Tyr Gly Gly Ala Met Asp Val Met Val Asn Val He Asn Asn 
360 365 370 

GGC ATC ATG AGT TTG GGG GCT TTT GGT GGG GTG CAA TTA GCC GGC AAT 480 
Gly He Met Ser Leu Gly Ala Phe Gly Gly Val Gin Leu Ala Gly Asn 
375 380 385 

TCA TGG CTT ATG GCG ACG CCG AGC TTT GAG GGC ATT TTA GTG GAG CAA 52 8 

Ser Trp Leu Met Ala Thr Pro Ser Phe Glu Gly He Leu Val Glu Gin 
390 395 400 

GCT TTG GTG AGC AAG AAA GCC ACT TCT TTC CAA TTT TTA TTC AAT GTG 576 
Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin Phe Leu Phe Asn Val 
405 410 415 420 



GCT CGC TTA AGG ATC TTA AAG CAT TCT AGC ATT GAA GCG GGC GTG 624 
y Ala Arg Leu Arg He Leu Lys His Ser Ser He Glu Ala Gly Val 
425 430 435 

AAG TTC CCC ATG TTA AAG AAA AAC CCC TAT ATC ACT GCA AAA AAC TTG 672 
Lys Phe Pro Met Leu Lys Lys Asn Pro Tyr He Thr Ala Lys Asn Leu 
440 445 450 

GAT ATA GGG TTT AGG CGC GTG TAT TCA TGG TAT GTG AAT TAT GTG TTC 720 
Asp He Gly Phe Arg Arg Val Tyr Ser Trp Tyr Val Asn Tyr Val Phe 
455 460 465 

ACT TTC TAG 729 
Thr Phe * 
470 



(2) ANGABEN ZU SEQ ID NO: 94: 
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( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 243 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 94: 

Met Lys Lys lie Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
15 10 15 

Asn Ala Leu Leu Ala Met Asp Gly Asn Gly Val Phe lie Gly Ala Gly 
20 25 30 

Tyr Leu Gin Gly Gin Ala Gin Met His Ala Asp lie Asn Ser Gin Lys 
35 40 45 

Gin Ala Thr Ser Ala Thr lie Lys Gly Phe Asp Ala Leu Leu Gly Tyr 
50 55 60 

In Phe Phe Phe Gly Lys Tyr Phe Gly Leu Arg Leu Tyr Gly Phe Phe 
,65 70 75 80 

^Asp Tyr Ala His Ala Asn Ser He Arg Leu Lys Asn Pro Asn Tyr Asn 
85 90 95 

Asn Glu Val Val Gin Leu Ala Gly Gin Val Leu Gly Lys Gin Glu He 
100 105 110 

Asn Arg Leu Thr Ser Leu Ala Asp Pro Lys Thr Phe Glu Pro Asn Met 
115 120 125 

Leu Thr Tyr Gly Gly Ala Met Asp Val Met Val Asn Val He Asn Asn 
130 135 140 

Gly He Met Ser Leu Gly Ala Phe Gly Gly Val Gin Leu Ala Gly Asn 
145 150 155 160 

Ser Trp Leu Met Ala Thr Pro Ser Phe Glu Gly He Leu Val Glu Gin 
165 170 175 

Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin Phe Leu Phe Asn Val 
180 185 190 

ly Ala Arg Leu Arg He Leu Lys His Ser Ser He Glu Ala Gly Val 
195 200 205 

Lys Phe Pro Met Leu Lys Lys Asn Pro Tyr He Thr Ala Lys Asn Leu 
210 215 220 

Asp He Gly Phe Arg Arg Val Tyr Ser Trp Tyr Val Asn Tyr Val Phe 
225 230 235 240 

Thr Phe * 

(2) ANGABEN ZU SEQ ID NO: 95: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 975 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 
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(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS099 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..975 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 95: 

ATG CCG GAA AAT TCT AAA CTA CAA CCT GCT AAG TTA GGG AAA AAT TTT 48 
Met Pro Glu Asn Ser Lys Leu Gin Pro Ala Lys Leu Gly Lys Asn Phe 
245 250 255 

GAC CCT GTG GAT CAT TCT AAC AGG AAT TTT TTC TTT TCT CTC ATT CTG 96 
Asp Pro Val Asp His Ser Asn Arg Asn Phe Phe Phe Ser Leu lie Leu 
260 265 270 275 

'CT GTA TTG TTA CAC TGG TTG ATT TAT TTT TTA TTT GAA CAC AGA GAA 144 
er Val Leu Leu His Trp Leu lie Tyr Phe Leu Phe Glu His Arg Glu 
280 285 290 

GAT TTT TTT CCT TCA AAA CCC AAG CTT GTT AAA TTA AAT CCT GAA AAT 192 
Asp Phe Phe Pro Ser Lys Pro Lys Leu Val Lys Leu Asn Pro Glu Asn 
295 300 305 

TTA TTG GTT TTA AAA AGA GGC CAT TCG CAA GAT CCC AGT AAA AAC ACC 240 
Leu Leu Val Leu Lys Arg Gly His Ser Gin Asp Pro Ser Lys Asn Thr 
310 315 320 

CAG GGC GCT CCT AAA CCC ACG CTG GCT GGC CCC CAA AAA CCT CCA ACG 2 88 

Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 
325 330 335 

CCT CCC ACA CCC CCA ACT CCG CCA ACC CCG CCA ACC CCG CCA AAA CCT 336 
Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
34 0 345 350 355 

ATA GAA AAG CCT AAG CCT GAG CCT AAA CCA AAA CCC AAA CCT GAA CCC 3 84 

~le Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
1 360 365 370 



AAG CCC AAT CAT AAA CAC AAG GCT CTT AAA AAA GTG GAA AAA GTG 432 
Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
375 380 385 

GAA GAG AAA AAA GTA GTA GAG GAG AAA AAA GAA GAG AAA AAA ATC GTA 480 
Glu Glu Lys Lys Val Val Glu Glu Lys Lys Glu Glu Lys Lys lie Val 
390 395 400 

GAG CAG AAA GTA GAA CAA AAA GTA GAG CAG AAA AAA ATA GAA GAG AAA 528 
Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys lie Glu Glu Lys 
405 410 415 

AAA CCT GTC AAA AAA GAA TTT GAC CCT AAC CAG CTT TCT TTC TTG CCT 576 
Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
420 425 430 435 
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AAA GAA GTT GCG CCA CCC AGA CAA GAA AAT AAT AAA GGC TTG GAT AAC 624 
Lys Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
440 445 450 

CAA ACC AGA AGG GAT ATT GAT GAA TTG TAT GGC GAA GAA TTT GGG GAT 672 
Gin Thr Arg Arg Asp lie Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
455 460 465 

TTA GGC ACA GCC GAA AAA GAT TTC ATC AGG AAT AAT TTA AGG GAT ATT 720 
Leu Gly Thr Ala Glu Lys Asp Phe lie Arg Asn Asn Leu Arg Asp He 
470 475 480 

GGG CGC ATC ACG CAA AAA TAT TTA GAA TAC CCT CAA GTA GCG GCT TAT 768 
Gly Arg He Thr Gin Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
485 490 495 

TTA GGG CAG GAC GGG ACG AAT GCG GTA GAG TTT TAC TTG CAC CCT AAT 816 
Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
500 505. 510 515 

GGC GAT ATT ACC GAT CTT AAA ATC ATC ATT GGC TCT GAA TAC AAA ATG 864 
ly Asp He Thr Asp Leu Lys He He He Gly Ser Glu Tyr Lys Met 
520 525 530 

CTT GAT GAC AAC ACC TTA AAG ACC ATT CAG ATC GCT TAT AAG GAT TAC 912 
Leu Asp Asp Asn Thr Leu Lys Thr He Gin He Ala Tyr Lys Asp Tyr 
535 540 545 

CCA CGC CCC AAA ACT AAA ACC CTC ATT CGC ATC AGA GTG CGT TAT TAC 960 
Pro Arg Pro Lys Thr Lys Thr Leu He Arg He Arg Val Arg Tyr Tyr 
550 555 560 

TTA GGG GGC AAT TAA 975 
Leu Gly Gly Asn * 
565 



(2) ANGABEN ZU SEQ ID NO: 96: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 325 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(i±> ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 96: 



Met Pro Glu Asn 
1 

Asp Pro Val Asp 
20 

Ser Val Leu Leu 
35 

Asp Phe Phe Pro 
50 

Leu Leu Val Leu 
65 



Ser Lys Leu Gin 
5 

His Ser Asn Arg 

His Trp Leu He 
40 

Ser Lys Pro Lys 
55 

Lys Arg Gly His 
70 



Pro Ala Lys Leu 
10 

Asn Phe Phe Phe 
25 

Tyr Phe Leu Phe 



Leu Val Lys Leu 
60 

Ser Gin Asp Pro 
75 



Gly Lys Asn Phe 
15 

Ser Leu He Leu 
30 

Glu His Arg Glu 
45 

Asn Pro Glu Asn 



Ser Lys Asn Thr 
80 
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Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 
85 90 95 

Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
100 105 110 

He Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
115 120 125 

Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
130 135 140 

Glu Glu Lys Lys Val Val Glu Glu Lys Lys Glu Glu Lys Lys He Val 
14 5 150 155 160 

Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys He Glu Glu Lys 
165 170 175 

Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
180 185 190 

ys Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
195 200 205 

Gin Thr Arg Arg Asp He Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
210 215 220 

Leu Gly Thr Ala Glu Lys Asp Phe He Arg Asn Asn Leu Arg Asp He 
225 230 235 240 

Gly Arg He Thr Gin Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
245 250 255 

Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
260 265 270 

Gly Asp He Thr Asp Leu Lys He He He Gly Ser Glu Tyr Lys Met 
275 280 285 

Leu Asp Asp Asn Thr Leu Lys Thr He Gin He Ala Tyr Lys Asp Tyr 
290 295 300 

Pro Arg Pro Lys Thr Lys Thr Leu He Arg He Arg Val Arq Tyr Tyr 
"05 310 315 320 

reu Gly Gly Asn * 
325 

(2) ANGABEN ZU SEQ ID NO: 97: 

( i ) S EQTJENZ KENNZ E I CHEN : 

(A) LANGE: 12 90 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPS117 (HPS118, HPS162) 



(ix) MERKMAL: 
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(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1290 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 97: 

ATG CCA TAC GCC TTA AGA AAA AGA TTT TTC AAA CGC TTT GCG CTG ATT 48 
Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lys Arg Phe Ala Leu Xle 
330 335 340 

GTT TCA ACT TTT TGT GCG ATA AGC TTG AAC GCT AAA AGC TAT CTG TTT 96 
Val Ser Thr Phe Cys Ala lie Ser Leu Ash Ala Lys Ser Tyr Leu Phe 
345 350 355 

TCC CCT TTG CCC CCA GCA CAC CAG CAA ATC ATT AAG ACA GAG CCT TGC 144 
Ser Pro Leu Pro Pro Ala His Gin Gin lie lie Lys Thr Glu Pro Cys 
360 365 370 



h. 



TCT TTG GAA TGC TTG AAA GAC TTG ATG CTG CAA AAT CAA ATC TTT TCT 192 
Ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin lie Phe Ser 
375 380 385 



T GTG TCT CAA TAC GAT AAC AAC AAC CAA GAT GAG AGC CTT AAA ACT 24 0 

he Val Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr 
390 395 400 405 

TAT TAT CAT GAC ATA CTC AAT AAA CTC AAC CCC GTA TTC ATC GCT TCT 288 
Tyr Tyr His Asp lie Leu Asn Lys Leu Asn Pro Val Phe lie Ala Ser 
410 415 420 

CAA ACT CCA GCT AAA GAA AGC TAT GAG CCT AAG ATT GAA TTA GCG GTT 33 6 

Gin Thr Pro Ala Lys Glu Ser Tyr Glu Pro Lys lie Glu Leu Ala Val 
425 430 435 

TTA CTG CCT AAA AAG GTG GTG GGG CGT TAT GCG ATT TCG GTG ATG AAC 3 84 

Leu Leu Pro Lys Lys Val Val Gly Arg Tyr Ala lie Ser Val Met Asn 
440 445 450 

ACC CTT TTA GCG TAT TTG AAC ACC AGA AAC AAC GAT TTC AAT ATC CAA 432 
Thr Leu Leu Ala Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn lie Gin 
455 460 465 



GTC TTT GAC AGC GAT GAA GAA AGC CCT GAA AAA TTA GAG CAA ACC TAT 480 
al Phe Asp Ser Asp Glu Glu Ser Pro Glu Lys Leu Glu Gin Thr Tyr 
0 475 480 485 



AAA GAA ATT GAA AAA GAA AAA TTC CCT TTT GTG ATA GCC TTA TTG ACT 528 
Lys Glu lie Glu Lys Glu Lys Phe Pro Phe Val lie Ala Leu Leu Thr 
490 495 500 

AAA GAG GGC GTG GAA AAT TTG CTC CAA AAC ACC ACC ATT AGC ACC CCT 576 
Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr lie Ser Thr Pro 
505 510 515 

ACT TAT GTG CCT ACG GTG AAT AGA GCG CAA TTG GAA AAT CAA ACT GAA 624 
Thr Tyr Val Pro Thr Val Asn Arg Ala Gin Leu Glu Asn Gin Thr Glu 
520 525 530 

CGT TCT TTG AGC GAG CGC TTG TAT TTT GGG GGG ATT GAT TAT AAA GAG 672 
Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly lie Asp Tyr Lys Glu 
535 540 545 
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CAA TTA AGC ATG CTC. ACG GCT TTC ATT AAC CCT AAT TCG CCC GTG ATT 720 
Gin Leu Ser Met Leu Thr Ala Phe lie Asn Pro Asn Ser Pro Val lie 
550 555 560 565 

GAA TAC GAT GAC GAT GGC CTA ATA GGT GAA CGC TTG AGG CAA ATC ACG 768 
Glu Tyr Asp Asp Asp Gly Leu lie Gly Glu Arg Leu Arg Gin lie Thr 
570 575 580 

GAG TCT TTA AGC ATT GAA GTC AAA CAC CAA GAA AAT ATT TCT TAC AAG 816 
Glu Ser Leu Ser lie Glu Val Lys His Gin Glu Asn lie Ser Tyr Lys 
585 590 595 

CAA GCC ACG AGT TTT TCT AAA AAT TTT AGA AAA AAC GAT GCG TTT TTT 864 
Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala Phe Phe 
600 605 610 

AAA AAT TCT ATT TTG ATT TTA AAC ACC CCT ACC ACT AAA AGC GGC CTT 912 
Lys Asn Ser lie Leu lie Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu 
615 620 625 



TT CTT TCT CAA ATA qqq CTT TTA GAA TAC AAG CCT CTT AAA ATC CTT 960 
Je Leu Ser Gin lie Gly Leu Leu Glu Tyr Lys Pro Leu Lys lie Leu 
0 635 640 645 



TCC ACA CAA ATC AAT TTC AAC CCC TCT CTA CTC TTA CTC ACC CAA CCT 1008 
Ser Thr Gin lie Asn Phe Asn Pro Ser Leu Leu Leu Leu Thr Gin Pro 
650 655 660 

AAA GAC AGA AAG GAT TTA TTC ATT GTC AAT GCC TTG CAA AAT AGC GAT 1056 
Lys Asp Arg Lys Asp Leu Phe lie Val Asn Ala Leu Gin Asn Ser Asp 
665 670 675 

GAA ACG CTT ATA GAA TAC GCC TCC TTA TTG GAG AGC GAT TTA AGG CAT 1104 
Glu Thr Leu lie Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
680 685 690 

GAT TGG GTG AAT TAT TCC AGC GCA ATC GGG CTA GAG GTG TTT TTA AAC 1152 
Asp Trp Val Asn Tyr Ser Ser Ala lie Gly Leu Glu Val Phe Leu Asn 
695 700 705 

ACG CTA GAT CCG CAT TTT AAA AAA TCT TTT CAA GAG AAT TTA GAA GAC 1200 
Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 
710 715 720 725 



.T CAG GTC CGT TAC CAC AAT CAA ATT TAT CAG GCT TTA GGG TAT TCT 1248 
n Gin Val Arg Tyr His Asn Gin lie Tyr Gin Ala Leu Gly Tyr Ser 
730 735 740 



TTT GAG CCA ATA AAA AAT GAA AGC GGA ACA AAA AAA GAA TAA 1290 
Phe Glu Pro lie Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
745 750 755 



(2) ANGABEN ZU SEQ ID NO: 98: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 430 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 98: 
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Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lys Arg Phe Ala Leu lie 

1 5 . 10 15 

Val Ser Thr Phe Cys Ala lie Ser Leu Asn Ala Lys Ser Tyr Leu Phe 

20 25 30 

Ser Pro Leu Pro Pro Ala His Gin Gin lie lie Lys Thr Glu Pro Cys 

35 40 45 

Ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin lie Phe Ser 

50 55 60 

Phe Val Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr 

65 70 75 80 

Tyr Tyr His Asp lie Leu Asn Lys Leu Asn Pro Val Phe lie Ala Ser 

85 90 95 



Gin Thr Pro Ala Lys Glu Ser Tyr Glu Pro Lys lie Glu Leu Ala Val 
100 105 110 



u Leu Pro Lys Lys Val Val Gly Arg Tyr Ala lie Ser Val Met Asn 
115 120 125 



Thr Leu Leu Ala Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn lie Gin 
130 135 140 

Val Phe Asp Ser Asp Glu Glu Ser Pro Glu Lys Leu Glu Gin Thr Tyr 
145 150 155 160 

Lys Glu lie Glu Lys Glu Lys Phe Pro Phe Val He Ala Leu Leu Thr 
165 170 175 

Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr He Ser Thr Pro 
180 185 190 

Thr Tyr Val Pro Thr Val Asn Arg Ala Gin Leu Glu Asn Gin Thr Glu 
195 200 205 

Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly He Asp Tyr Lys Glu 
210 215 220 



Gin Leu Ser Met Leu Thr Ala Phe He Asn Pro Asn Ser Pro Val He 
5 230 235 240 



u Tyr Asp Asp Asp Gly Leu He Gly Glu Arg Leu Arg Gin He Thr 

245 250 255 

Glu Ser Leu Ser He Glu Val Lys His Gin Glu Asn He Ser Tyr Lys 
260 265 270 

Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala Phe Phe 
275 280 285 

Lys Asn Ser He Leu He Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu 

290 295 300 

He Leu Ser Gin He Gly Leu Leu Glu Tyr Lys Pro Leu Lys He Leu 
305 310 315 320 

Ser Thr Gin He Asn Phe Asn Pro Ser Leu Leu Leu Leu Thr Gin Pro 

325 330 335 
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Lys Asp Arg Lys Asp Leu Phe lie Val Asn Ala Leu Gin Asn Ser Asp 
340 345 350 

Glu Thr Leu lie Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
355 360 365 

Asp Trp Val Asn Tyr Ser Ser Ala lie Gly Leu Glu Val Phe Leu Asn 
370 375 380 

Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 
385 390 395 400 

Asn Gin Val Arg Tyr His Asn Gin lie Tyr Gin Ala Leu Gly Tyr Ser 
405 410 415 

Phe Glu Pro lie Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
420 425 430 

(2) ANGABEN ZU SEQ ID NO: 99: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1644 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS004 (HPS027, HPS121, HPS131) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1644 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 99 



ATG 
Met 


GAT 
Asp 


AAA 
Lys 


AAC 
Asn 


AAC 
Asn 
435 


AAT 
Asn 


AAT 
Asn 


CTC 
Leu 


CGC 
Arg 


TTG 
Leu 
440 


ATT 
He 


TTA 
Leu 


GCG 
Ala 


ATC 
He 


GCT 
Ala 
445 


CTG 
Leu 


TCT 

r 


TTC 
Phe 


TTG 
Leu 


TTT 
Phe 
450 


ATC 
He 


GCT 
Ala 


CTT 
Leu 


TAT 
Tyr 


AGC 
Ser 
455 


TAT 
Tyr 


TTT 
Phe 


TTC 
Phe 


CAA 
Gin 


AAA 
Lys 
460 


CCA 
Pro 


AAC 
Asn 


AAA 
Lys 


ACA 
Thr 


ACA 
Thr 
465 


ACC 
Thr 


CAA 
Gin 


ACC 
Thr 


ACA 
Thr 


AAG 
Lys 
470 


CAA 
Gin 


GAA 
Glu 


ACA 
Thr 


ACC 
Thr 


AAC 
Asn 
475 


AAC 
Asn 


CAT 
His 


ACA 
Thr 


GCA 
Ala 


ACA 
Thr 
480 


AGT 
Ser 


CCT 
Pro 


AAC 
Asn 


GCG 
Ala 


CCC 
Pro 
485 


AAC 
Asn 


GCC 
Ala 


CAA 
Gin 


CAT 
His 


TTT 
Phe 
490 


AGC 
Ser 


ACC 
Thr 


ACT 
Thr 


CAA 
Gin 


ACA 
Thr 
495 


ACC 
Thr 


CCC 
Pro 


CAA 
Gin 


GAG 
Glu 


AAT 
Asn 
500 


TTG 
Leu 


CTA 
Leu 


AGC 
Ser 


ACG 
Thr 


ATT 
He 
505 


TCT 
Ser 


TTT 
Phe 


GAG 
Glu 


CAT 
His 


GCC 
Ala 
510 


AGG 
Arg 


ATT 
He 


GAA 
Glu 


ATT 
He 


GAT 
Asp 
515 


TCT 
Ser 


TTA 
Leu 


GGG 
Gly 


CGC 
Arg 


ATC 
He 
520 


AAA 
Lys 


CAG 
Gin 


GTT 
Val 


TAT 
Tyr 


CTC 
Leu 
525 


AAG 
Lys 



48 



96 



144 



192 



240 



288 



(7 
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GAT AAA AAG TAT CTA ACC CCT AAA CAA AAG GGC TTT TTA GAG CAT GTG 336 
Asp Lys Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
530 535 540 

GGC CAT CTT TTT AGC TCC AAA GAA AAC GCG CAA CCC CCC CTA AAA GAG 3 84 

Gly His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
545 550 555 

CTC CCC CTT TTA GCA GCC GAT AAA CTC AAG CCT TTA GAA GTG CGT TTT 432 
Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
560 565 570 

TTA GAC CCT ACG CTC AAT AAC AAA GCG TTC AAC ACC CCT TAT AGC GCT 4 80 

Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
575 580 585 590 

TCA AAA ACC ACT CTT GGG CCT AAC GAA CAG CTT GTT TTA ACC CAA GAT 528 
Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
595 600 605 

£TTA GGC ACT CTT AGC ATC ATT AAA ACC CTG ACT TTC TAT GAT GAT TTG 576 
eu Gly Thr Leu Ser He He Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
610 615 620 

CAT TAT GAT TTA AAA ATC GCA TTC AAA TCG CCC AAT AAC CTT ATC CCT 624 
His Tyr Asp Leu Lys He Ala Phe Lys Ser Pro Asn Asn Leu He Pro 
625 630 635 

AGC TAT GTG ATC ACC AAT GGT TAC AGG CCG GTG GCT GAT TTG GAC AGC 672 
Ser Tyr Val He Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
640 645 650 

TAC ACC TTT TCA GGC GTG CTT TTA GAA AAT AGC GAC AAA AAA ATT GAA 72 0 

Tyr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys He Glu 
655 660 665 670 

AAA ATT GAA GAT AAA GAC GCT AAA GAA ATC AAA CGC TTT TCT AAC ACC 768 
Lys He Glu Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr 
675 680 685 

CTC TTT TTA TCC AGC GTG GAT AGG TAT TTC ACC ACC TTG CTT TTC ACT 816 
Leu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr 
690 695 700 



GAT CCT CAA GGT TTT GAA GCC TTA ATT GAT TCA GAA ATC GGC ACT 864 
ys Asp Pro Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly Thr 
705 710 715 

AAA AAC CCC TTA GGG TTC ATT TCC CTT AAA AAT GAA GCG AAT TTG CAT 912 
Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
720 725 730 

GGC TAT ATT GGC CCT AAG GAT TAC CGC TCT TTG AAA GCG ATT TCA CCC 960 
Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
735 740 745 750 

ATG CTC ACC GAT GTG ATA GAG TAT GGC TTA ATC ACT TTC TTT GCA AAA 1008 
Met Leu Thr Asp Val He Glu Tyr Gly Leu He Thr Phe Phe Ala Lys 
755 760 765 

GGC GTG TTT GTT TTA CTG GAT TAT TTG TAT CAA TTC GTG GGC AAT TGG 1056 
Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
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770 775 780 

GGT TGG GCT ATC ATT CTT TTA ACG ATT ATC GTG CGC ATC ATC CTT TAT 1104 
Gly Trp Ala lie tie Leu Leu Thr lie lie Val Arg lie He Leu Tyr 
785 790 795 

CCT TTA AGC TAT AAG GGC ATG GTG AGC ATG CAA AAG CTC AAA GAA TTA 1152 
Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
800 805 810 

GCC CCT AAA ATG AAA GAA CTC CAA GAA AAA TAC AAG GGC GAA CCC CAA 1200 
Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
815 820 825 830 

AAA TTG CAA GCC CAC ATG ATG CAG CTT TAC AAA AAA CAT GGG GCT AAC 124 8 

Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
835 840 845 

CCA CTA GGG GGT TGT CTG CCC TTA ATC TTA CAA ATC CCG GTG TTT TTT 12 96 

Pro Leu Gly Gly Cys Leu Pro Leu He Leu Gin He Pro Val Phe Phe 
850 855 860 

CC ATT TAT AGA GTG CTT TAT AAC GCT GTG GAA TTG AAA AGC TCA GAG 1344 
la He Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
865 870 875 

TGG ATC TTA TGG ATT CAT GAT TTA TCC ATC ATG GAT CCG TAT TTT ATT 13 92 

Trp He Leu Trp He His Asp Leu Ser He Met Asp Pro Tyr Phe He 
880 885 890 

TTA CCG CTT CTT ATG GGA GCG TCT ATG TAT TGG CAC CAA AGC GTT ACG 144 0 

Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
895 900 905 910 

CCA AAC ACC ATG ACC GAT CCC ATG CAA GCA AAG ATT TTT AAA CTC TTA 14 88 

Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys He Phe Lys Leu Leu 
915 920 925 

CCC CTA TTA TTC ACA ATC TTT TTA ATC ACT TTC CCG GCA GGG TTA GTC 1536 
Pro Leu Leu Phe Thr He Phe Leu He Thr Phe Pro Ala Gly Leu Val 
930 935 940 

TTG TAT TGG ACC ACG AAC AAC ATC CTT TCG GTG TTG CAA CAA CTC ATC 1584 
pu Tyr Trp Thr Thr Asn Asn He Leu Ser Val Leu Gin Gin Leu He 
945 950 955 

ATC AAT AAA GTC TTA GAG AAT AAA AAA CGC ATG CAT GCG CAA AAC AAA 1632 
He Asn Lys Val Leu Glu Asn Lys Lys Arg Met His Ala Gin Asn Lys 
960 965 970 

AAG GAA CAT TGA 1644 

Lys Glu His * 

975 



(2) ANGABEN ZU SEQ ID NO: 100: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 548 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS : Protein 

(xi) SEQTJENZBESCHREIBUNG: SEQ ID NO: 100: 

Met Asp Lys Asn Asn Asn Asn Leu Arg Leu lie Leu Ala lie Ala Leu 
15 10 15 

Ser Phe Leu Phe lie Ala Leu Tyr Ser Tyr Phe Phe Gin Lys Pro Asn 
20 25 30 

Lys Thr Thr Thr Gin Thr Thr Lys Gin Glu Thr Thr Asn Asn His Thr 
35 40 45 

Ala Thr Ser Pro Asn Ala Pro Asn Ala Gin His Phe Ser Thr Thr Gin 
50 55 60 

Thr Thr Pro Gin Glu Asn Leu Leu Ser Thr lie Ser Phe Glu His Ala 
65 70 75 80 

Arg lie Glu lie Asp Ser Leu Gly Arg lie Lys Gin Val Tyr Leu Lys 
85 90 95 

sp Lys Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
100 105 110 

Gly His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
115 120 125 

Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
130 135 140 

Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
145 150 155 160 

Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
165 170 175 

Leu Gly Thr Leu Ser He He Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
180 185 190 

His Tyr Asp Leu Lys He Ala Phe Lys Ser Pro Asn Asn Leu lie Pro 
195 200 205 

Ser Tyr Val He Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
210 215 220 

yr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys He Glu 
225 230 235 240 

Lys He Glu Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr 
245 250 255 

Leu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr 
260 265 270 

Lys Asp Pro Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly Thr 
275 280 285 

Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
290 295 300 

Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
305 310 315 320 
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Met Leu Thr Asp Val lie Glu Tyr Gly Leu He Thr Phe Phe Ala Lys 
325 330 335 

Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
340 345 350 

Gly Trp Ala He He Leu Leu Thr He He Val Arg He He Leu Tyr 
355 360 365 

Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
370 375 380 

Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
385 390 395 400 

Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
405 410 415 



Pro Leu Gly Gly Cys Leu Pro Leu He Leu Gin He Pro Val Phe Phe 
420 425 430 



a He Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
435 440 445 




Trp He Leu Trp He His Asp Leu Ser He Met Asp Pro Tyr Phe He 
450 455 460 

Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
465 470 475 480 

Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys He Phe Lys Leu Leu 
485 490 495 

Pro Leu Leu Phe Thr He Phe Leu He Thr Phe Pro Ala Gly Leu Val 
500 505 510 

Leu Tyr Trp Thr Thr Asn Asn He Leu Ser Val Leu Gin Gin Leu He 
515 520 525 

He Asn Lys Val Leu Glu Asn Lys Lys Arg Met His Ala Gin Asn Lys 
530 535 540 

Lys Glu His * 
,45 

) ANGABEN ZU SEQ ID NO: 101: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 3063 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS132 



( ix) MERKMAL : 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..3063 
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^^^^^^^ 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 101: 

ATG ATG CTC GCT TCC ATT ATT GAA TTT TCC TTA CGC CAA AGA GTG ATC 4 8 

Met Met Leu Ala Ser lie lie Glu Phe Ser Leu Arg Gin Arg Val He 
550 555 560 

GTG ATT GTT GGT GCG ATT CTT ATT TTA TTT TTT GGG ACT TAT AGT TTT 96 
Val He Val Gly Ala He Leu He Leu Phe Phe Gly Thr Tyr Ser Phe 
565 570 575 580 

ATC AAC ACT CCA GTG GAC GCT TTC CCG GAT ATT TCG CCC ACT CAA GTT 144 
He Asn Thr Pro Val Asp Ala Phe Pro Asp He Ser Pro Thr Gin Val 
585 590 595 

AAA ATC ATT TTA AAA CTC CCC GGC TCT AGC CCT GAA GAA ATG GAA AAC 192 
Lys He He Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
600 . 605 610 

AAC ATC GTG CGC CCT TTA GAA TTG GAG CTT TTA GGC TTG AAA GGG CAA 24 0 

Asn lie Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 
615 620 625 




TCT TTA AGG AGT GTT TCA AAA TAT TCT ATT TCA GAT ATT ACG ATA 288 
Lys Ser Leu Arg Ser Val Ser Lys Tyr Ser He Ser Asp He Thr He 
630 635 640 

GAT TTT GAT GAC AGC GTG GAT ATT TAT TTA GCG AGG AAT ATT GTC AAT 336 
Asp Phe Asp Asp Ser Val Asp He Tyr Leu Ala Arg Asn He Val Asn 
645 650 655 660 

GAG CGC TTG AGC AGC GTG ATG AAA GAT TTA CCC GTG GGG GTT GAG GGG 384 
Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
665 670 675 

GGC ATG GCG CCC ATT GTT ACG CCG CTA TCA GAT ATC TTT ATG TTC ACT 4 32 

Gly Met Ala Pro He Val Thr Pro Leu Ser Asp He Phe Met Phe Thr 
680 685 690 

ATT GAT GGC AAT ATC ACT GAG ATA GAA AAA CGA CAG CTT TTA GAT TTT 480 
He Asp Gly Asn He Thr Glu He Glu Lys Arg Gin Leu Leu Asp Phe 
695 700 705 

GTG ATC CGC CCA CAA TTA AGA ATG ATT AGC GGC GTA GCA GAT GTC AAT 528 
* [al He Arg Pro Gin Leu Arg Met He Ser Gly Val Ala Asp Val Asn 
710 715 720 

TCC ATT GGA GGC TTT AGC AGA GCG TTT GTG ATC GTG CCG GAT TTT AAT 576 
Ser He Gly Gly Phe Ser Arg Ala Phe Val He Val Pro Asp Phe Asn 
725 730 735 740 

GAC ATG GCA AGG CTT GGG GTG AGT ATT TCT GAT TTA GAA TCG GCT GTG 624 
Asp Met Ala Arg Leu Gly Val Ser He Ser Asp Leu Glu Ser Ala Val 
745 750 755 

AGA GTG AAT TTA AGA AAC AGC GGA GCG GGG CGC GTG GAT AGA GAT GGC 672 
Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
760 765 770 

GAA ACC TTT TTA GTC AAA ATC CAA ACC GCT TCT TTG AGT TTA GAA GAC 72 0 

Glu Thr Phe Leu Val Lys He Gin Thr Ala Ser Leu Ser Leu Glu Asp 
775 780 785 
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ATT GGC AAA ATC ACC GTT TCC ACT AAT TTA GGG CAT TTG CAC ATT AAG 768 
lie Gly Lys He Thr Val Ser Thr Asn Leu Gly His Leu His He Lys 
790 795 800 

GAT TTT GCG AAA GTC ATC AGC CAG TCT CGC ACC CGT TTG GGG TTT GTT 816 
Asp Phe Ala Lys Val He Ser Gin Ser Arg Thr Arg Leu Gly Phe Val 
805 810 815 820 

ACT AAA GAT GGC GTG GGC GAG ACC ACA GAA GGC TTG GTG CTT TCT TTA 864 
Thr Lys Asp Gly Val Gly Glu Thr Thr Glu Gly Leu Val Leu Ser Leu 
825 830 835 

AAA GAC GCT AAC ACC AAA GAA ATC ATC ACT CAA GTG TAT CAA AAA CTA 912 
Lys Asp Ala Asn Thr Lys Glu He He Thr Gin Val Tyr Gin Lys Leu 
840 845 850 

GAA GAA TTA AAA CCC TTT TTA CCG AAT GGC GTG TCC ATT AAT GTT TTT 960 
Glu Glu Leu Lys Pro Phe Leu Pro Asn Gly Val Ser He Asn Val Phe 
855 860 865 



'AT GAT CGC TCA GAA TTT ACG CAA AAA GCC ATT GCC ACC GTT TCT AAA 1008 
r Asp Arg Ser Glu Phe Thr Gin Lys Ala He Ala Thr Val Ser Lys 
870 875 880 



ACC CTC ATT GAA GCC GTT GTT TTA ATC ATC ATC ACG CTC TTT TTA TTT 1056 
Thr Leu He Glu Ala Val Val Leu He He He Thr Leu Phe Leu Phe 
885 890 895 900 

TTA GGG AAT TTG AGG GCG AGC GTG GCT GTG GGG GTG ATT TTA CCT TTA 1104 
Leu Gly Asn Leu Arg Ala Ser Val Ala Val Gly Val He Leu Pro Leu 
905 910 915 

AGC TTG TCC GTG GCG TTT ATT TTT ATC AAG TTT AGC GAT CTG ACT TTA 1152 
Ser Leu Ser Val Ala Phe He Phe He Lys Phe Ser Asp Leu Thr Leu 
920 925 930 

AAT TTG ATG AGT TTA GGG GGA TTG GTT ATC GCT ATA GGC ATG CTC ATT 1200 
Asn Leu Met Ser Leu Gly Gly Leu Val He Ala He Gly Met Leu He 
935 940 945 



GAC TCA GCC GTG GTG GTG GTG GAA AAC GCT TTT GAA AAA TTA AGC GCT 124 8 

Asp Ser Ala Val Val Val Val Glu Asn Ala Phe Glu Lys Leu Ser Ala 
950 955 960 



C ACT AAA ACC ACT AAA CTC CAT GCA ATC TAT CGT TCG TGT AAA GAA 12 96 

sn Thr Lys Thr Thr Lys Leu His Ala He Tyr Arg Ser Cys Lys Glu 
965 970 975 980 

ATC GCT GTT TCA GTG GTG AGC GGG GTG GTG ATC ATC ATT GTG TTT TTT 1344 
He Ala Val Ser Val Val Ser Gly Val Val He He He Val Phe Phe 
985 990 995 

GTG CCG ATT TTA ACC TTA CAG GGG TTA GAG GGT AAG ATG TTT AGG CCT 13 92 

Val Pro He Leu Thr Leu Gin Gly Leu Glu Gly Lys Met Phe Arg Pro 
1000 1005 1010 

TTA GCG CAA AGC ATT GTG TAT GCG CTT TTA GGC ACT TTA GTT CTA TCT 1440 
Leu Ala Gin Ser He Val Tyr Ala Leu Leu Gly Thr Leu Val Leu Ser 
1015 1020 1025 

ATT ACA ATC ATT CCT GTA GTC AGC TCT CTT GTC TTA AAA GCC ACG CCC 14 88 

He Thr He He Pro Val Val Ser Ser Leu Val Leu Lys Ala Thr Pro 
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1030 1035 1040 

CAT AGC GAA ACC TTT TTA ACG AGG TTT TTA AAC AGA ATC TAC GCC CCT 153 6 

His Ser Glu Thr Phe Leu Thr Arg Phe Leu Asn Arg lie Tyr Ala Pro 
1045 1050 1055 1060 

TTA TTG GAA TTT TTT GTG CAT AAC CCT AAA AAA GTG ATT TTA GGA GCG 15 84 

Leu Leu Glu Phe Phe Val His Asn Pro Lys Lys Val lie Leu Gly Ala 
1065 1070 1075 

TTT GTT TTT TTA ATC GCA AGC CTT TCT TTA TTC CCT TTT GTG GGG AAG 1632 
Phe Val Phe Leu lie Ala Ser Leu Ser Leu Phe Pro Phe Val Gly Lys 
1080 1085 1090 

AAT TTC ATG CCC GTT TTA GAT GAG GGC GAT GTG GTT TTG AGC GTG GAA 1680 
Asn Phe Met Pro Val Leu Asp Glu Gly Asp Val Val Leu Ser Val Glu 
1095 1100 1105 

ACC ACC CCT TCT ATT TCT TTA GAT CAA TCT AGG GAT CTC ATG CTA AAC 1728 
Thr Thr Pro Ser lie Ser Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
1110 1115 1120 

TT GAG AGC GCG ATT AAA AAG CAT GTC AAG GAA GTT AAA AGC ATT GTC 1776 
lie Glu Ser Ala lie Lys Lys His Val Lys Glu Val Lys Ser lie Val 
H25 1130 1135 1140 

GCG CGC ACA GGG AGC GAT GAA TTG GGG CTG GAT TTA GGA GGT TTG AAT 1824 
Ala Arg Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
1145 1150 1155 

CAA ACC GAT ACT TTT ATT TCT TTT ATT CCT AAA AAA GAA TGG AGC GTT 1872 
Gin Thr Asp Thr Phe lie Ser Phe He Pro Lys Lys Glu Trp Ser Val 
1160 1165 1170 

AAA ACC AAA GAT GAA TTA TTA GAA AAA ATC ATG GAT TCT TTA AAA GAC 192 0 

Lys Thr Lys Asp Glu Leu Leu Glu Lys He Met Asp Ser Leu Lys Asp 
1175 1180 1185 

TTT AAG GGG ATT AAC TTT TCT TTC ACC CAA CCC ATT GAA ATG AGA ATT 1968 
Phe Lys Gly He Asn Phe Ser Phe Thr Gin Pro He Glu Met Arg He 
1190 1195 1200 



• 



TCT GAA ATG CTG ACA GGG GTT AGG GGG GAT TTA GCG GTT AAG ATT TTT 2 016 

~ er Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys He Phe 
05 1210 1215 1220 



GGA GAT GGT ATT AGC GAA TTG AAT GAA TTG AGT TTT CAA ATC GCG CAA 2 064 

Gly Asp Gly He Ser Glu Leu Asn Glu Leu Ser Phe Gin He Ala Gin 
1225 1230 1235 

GCT CTA AAA GGG ATT AAA GGA TCT AGT GAA GTT TTA ACC ACG CTT AAT 2112 
Ala Leu Lys Gly He Lys Gly Ser Ser Glu Val Leu Thr Thr Leu Asn 
1240 1245 1250 

GAG GGC GTG AAT TAT TTG TAT GTA ACC CCT AAT AAA GAA TCG ATG GCG 2160 
Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
1255 1260 1265 

GAT GTG GGG ATC ACT AGC GAT GAA TTT TCC AAG TTT TTA AAA TCC GCT 220 8 

Asp Val Gly He Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
1270 1275 1280 
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TTA GAG GGC TTG GTT GTA GAT GTG ATC CCT ACA GGG ATT TCA CGC ACG 2256 
Leu Glu Gly Leu Val Val Asp Val lie Pro Thr Gly lie Ser Arg Thr 
1285 1290 1295 1300 



CCA GTG ATG ATC CGC CAA GAG AGC GAT TTT GCA AGC TCT ATC ACT AAA 23 04 

Pro Val Met lie Arg Gin Glu Ser Asp Phe Ala Ser Ser lie Thr Lys 
1305 1310 1315 

ATC AAA AGT TTA GCC TTG ACT TCA AAA TAT GGC GTT TTA GTG CCT ATC 2352 
lie Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro lie 
1320 1325 1330 

ACT TCT ATC GCC AAA ATT GAA GAA GTG GAT GGC CCT GTT TCT GTT GTG 2400 
Thr Ser lie Ala Lys He Glu Glu Val Asp Gly Pro Val Ser Val Val 
1335 1340 1345 

CGT GAA AAT TCA ATG CGC ATG AGC GTG GTT CGC AGT AAT GTG GTG GGG 2448 
Arg Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
1350 1355 1360 




CGC GAT TTG AAA TCT TTT GTA GAA GAG GCT AAA AAA GTG ATC GCT CAA 
,rg Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val He Ala Gin 
^365 1370 1375 1380 

AAC ATC AAA CTC CCT CCC AGC TAC TAT ATC ACT TAT GGG GGG CAG TTT 
Asn He Lys Leu Pro Pro Ser Tyr Tyr He Thr Tyr Gly Gly Gin Phe 
1385 1390 1395 



2496 



2544 



GAA AAC CAG CAA CGG GCC AAT AAA AGG CTC TCC ACC GTT ATC CCT TTA 2 592 

Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val He Pro Leu 
1400 1405 1410 

AGC ATC TTA GCG ATT TTT TTC ATT CTT TTT TTC ACT TTT AAA AGC ATT 2 640 

Ser He Leu Ala He Phe Phe He Leu Phe Phe Thr Phe Lys Ser He 
1415 1420 1425 

CCT TTA GCC TTG CTC ATT CTT TTG AAT ATC CCT TTT GCG GTT ACC GGA 2688 
Pro Leu Ala Leu Leu He Leu Leu Asn He Pro Phe Ala Val Thr Gly 
1430 1435 1440 

GGC CTT ATT GCG TTG TTT GCG GTC GGG GAG TAT ATT TCA GTG CCA GCG 2736 
Gly Leu He Ala Leu Phe Ala Val Gly Glu Tyr He Ser Val Pro Ala 
1445 1450 1455 1460 



C GTG GGC TTT ATC GCT CTT TTT GGG ATT GCG GTT TTA AAT GGC GTG 2784 
r Val Gly Phe He Ala Leu Phe Gly He Ala Val Leu Asn Gly Val 
1465 1470 1475 



GTG ATG ATA GGC TAT TTT AAA GAG CTT CTC TTG CAA GGG AAA AGC GTA 2 832 

Val Met He Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
1480 1485 1490 

GAA GAA TGC GTT TTA TTG GGC GCT AAA AGG CGT TTG AGA CCG GTT TTA 2 880 

Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
1495 1500 1505 



ATG ACC GCT TGC ATT GCC GGT TTG GGT TTG CTC CCT TTA TTA TTT TCT 2 92 8 
Met Thr Ala Cys He Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
1510 1515 1520 

CAT AGC GTG GGA TCA GAA GTC CAA AAA CCT TTA GCG ATC GTG GTG CTT 2 97 6 
His Ser Val Gly Ser Glu Val Gin Lys Pro Leu Ala He Val Val Leu 



• 
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1525 1530 1535 1540 

GGA GGC TTG GTT ACC TCA AGC GCT CTA ACC TTA CTC CTA CTG CCG CCA 3 024 

Gly Gly Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
1545 1550 1555 

ATG TTT ATG CTC ATC GCT AAA AAG ATT AAA ATC GTT TGA 3 063 

Met Phe Met Leu lie Ala Lys Lys lie Lys lie Val * 
1560 1565 



(2) ANGABEN ZU SEQ ID NO: 102: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1021 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 102: 

et Met Leu Ala Ser lie lie Glu Phe Ser Leu Arg Gin Arg Val lie 
15 10 15 

Val lie Val Gly Ala lie Leu lie Leu Phe Phe Gly Thr Tyr Ser Phe 
20 25 30 

lie Asn Thr Pro Val Asp Ala Phe Pro Asp He Ser Pro Thr Gin Val 
35 40 45 

Lys He He Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
50 55 60 

Asn He Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 
65 70 75 80 

Lys Ser Leu Arg Ser Val Ser Lys Tyr Ser He Ser Asp He Thr He 
85 90 95 

Asp Phe Asp Asp Ser Val Asp He Tyr Leu Ala Arg Asn He Val Asn 
100 105 110 

Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
115 120 125 

y Met Ala Pro He Val Thr Pro Leu Ser Asp He Phe Met Phe Thr 
130 135 140 

He Asp Gly Asn He Thr Glu He Glu Lys Arg Gin Leu Leu Asp Phe 
145 150 155 160 

Val He Arg Pro Gin Leu Arg Met He Ser Gly Val Ala Asp Val Asn 
165 170 175 

Ser He Gly Gly Phe Ser Arg Ala Phe Val He Val Pro Asp Phe Asn 
180 185 190 

Asp Met Ala Arg Leu Gly Val Ser He Ser Asp Leu Glu Ser Ala Val 
195 200 205 

Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
210 215 220 
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Glu Thr Phe Leu Val Lys lie Gin Thr Ala Ser Leu Ser Leu Glu Asp 
225 230 235 240 

He Gly Lys He Thr Val Ser Thr Asn Leu Gly His Leu His lie Lys 
245 250 255 

Asp Phe Ala Lys Val He Ser Gin Ser Arg Thr Arg Leu Gly Phe Val 
260 265 270 

Thr Lys Asp Gly Val Gly Glu Thr Thr Glu Gly Leu Val Leu Ser Leu 
275 280 285 

Lys Asp Ala Asn Thr Lys Glu lie He Thr Gin Val Tyr Gin Lys Leu 
290 295 300 

Glu Glu Leu Lys Pro Phe Leu Pro Asn Gly Val Ser He Asn Val Phe 
305 310 315 320 

Tyr Asp Arg Ser Glu Phe Thr Gin Lys Ala He Ala Thr Val Ser Lys 
325 330 335 

hr Leu He Glu Ala Val Val Leu He He He Thr Leu Phe Leu Phe 
340 345 350 

Leu Gly Asn Leu Arg Ala Ser Val Ala Val Gly Val He Leu Pro Leu 
355 360 365 

Ser Leu Ser Val Ala Phe He Phe He Lys Phe Ser Asp Leu Thr Leu 
370 375 380 

Asn Leu Met Ser Leu Gly Gly Leu Val He Ala He Gly Met Leu He 
385 390 395 400 

Asp Ser Ala Val Val Val Val Glu Asn Ala Phe Glu Lys Leu Ser Ala 
405 410 415 

Asn Thr Lys Thr Thr Lys Leu His Ala He Tyr Arg Ser Cys Lys Glu 
420 425 430 

He Ala Val Ser Val Val Ser Gly Val Val He He He Val Phe Phe 
435 440 445 

Val Pro He Leu Thr Leu Gin Gly Leu Glu Gly Lys Met Phe Arg Pro 
450 455 460 

eu Ala Gin Ser He Val Tyr Ala Leu Leu Gly Thr Leu Val Leu Ser 
465 470 475 480 

He Thr He He Pro Val Val Ser Ser Leu Val Leu Lys Ala Thr Pro 
485 490 495 

His Ser Glu Thr Phe Leu Thr Arg Phe Leu Asn Arg He Tyr Ala Pro 
500 505 510 

Leu Leu Glu Phe Phe Val His Asn Pro Lys Lys Val He Leu Gly Ala 
515 520 525 

Phe Val Phe Leu He Ala Ser Leu Ser Leu Phe Pro Phe Val Gly Lys 
530 535 540 

Asn Phe Met Pro Val Leu Asp Glu Gly Asp Val Val Leu Ser Val Glu 
545 550 555 560 



• 
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Thr Thr Pro Ser He Ser Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
565 570 575 

lie Glu Ser Ala lie Lys Lys His Val Lys Glu Val Lys Ser lie Val 
580 585 590 

Ala Arg Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
595 600 605 

Gin Thr Asp Thr Phe lie Ser Phe lie Pro Lys Lys Glu Trp Ser Val 
610 615 620 

Lys Thr Lys Asp Glu Leu Leu Glu Lys lie Met Asp Ser Leu Lys Asp 
625 630 635 640 

Phe Lys Gly lie Asn Phe Ser Phe Thr Gin Pro lie Glu Met Arg lie 
645 650 655 

Ser Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys lie Phe 
660 665 670 

y Asp Gly lie Ser Glu Leu Asn Glu Leu Ser Phe Gin He Ala Gin 
675 680 685 

Ala Leu Lys Gly He Lys Gly Ser Ser Glu Val Leu Thr Thr Leu Asn 
690 695 700 

Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
705 710 715 720 

Asp Val Gly He Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
725 730 735 

Leu Glu Gly Leu Val Val Asp Val He Pro Thr Gly He Ser Arg Thr 
740 745 750 

Pro Val Met He Arg Gin Glu Ser Asp Phe Ala Ser Ser He Thr Lys 
755 760 765 

He Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro He 
770 775 780 

Thr Ser He Ala Lys He Glu Glu Val Asp Gly Pro Val Ser Val Val 
^ 5 790 795 800 

g Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
805 810 815 

Arg Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val He Ala Gin 
820 825 830 

Asn He Lys Leu Pro Pro Ser Tyr Tyr He Thr Tyr Gly Gly Gin Phe 
835 840 845 

Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val He Pro Leu 
850 855 860 

Ser He Leu Ala He Phe Phe He Leu Phe Phe Thr Phe Lys Ser He 
865 870 875 880 

Pro Leu Ala Leu Leu He Leu Leu Asn He Pro Phe Ala Val Thr Gly 
885 890 895 
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Gly Leu He Ala Leu Phe Ala Val Gly Glu Tyr He Ser Val Pro Ala 
900 905 910 

Ser Val Gly Phe He Ala Leu Phe Gly He Ala Val Leu Asn Gly Val 
915 920 925 

Val Met He Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
930 935 940 

Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
945 950 955 960 

Met Thr Ala Cys He Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
965 970 975 

His Ser Val Gly Ser Glu Val Gin Lys Pro Leu Ala He Val Val Leu 
980 985 990 

Gly Gly Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
995 1000 1005 

et Phe Met Leu He Ala Lys Lys He Lys He Val * 
1010 1015 1020 

(2) ANGABEN ZU SEQ ID NO: 103: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2028 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS149 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1 . .2028 



• 



<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 103: 

'G TCT AAA GGT TTG AGT ATC GGT AAT AAA ATC ATA TTG TGC GTG GCG 48 
u Ser Lys Gly Leu Ser He Gly Asn Lys He He Leu Cys Val Ala 
1025 1030 1035 

TTG ATT GTG ATC GTG TGC GTG AGC ATT TTA GGG GTG TCC TTA AAC AGC 96 
Leu He Val He Val Cys Val Ser He Leu Gly Val Ser Leu Asn Ser 
1040 1045 1050 

AGG GTG AAA GAG ATT TTA AAA GAA AGC GCT CTG CAT TCT ATG CAA GAT 144 
Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
1055 1060 1065 

AGT TTG CAT TTT AAG GTT AAT GAA GTG CAA GGG GTT TTA GAA AAC ACT 192 
Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
1070 1075 1080 1085 

TAT ACG AGC ATG GGC ATT GTT AAA GAA ATG CTC CCT AAA GAC ACC AAA 24 0 

Tyr Thr Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
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1090 1095 1100 

AGA GAA ATC AAA ATC GGC TTG TTA AAA AAC TTC ATT TTA GCC AAT TCG 2 88 

Arg Glu lie Lys lie Gly Leu Leu Lys Asn Phe lie Leu Ala Asn Ser 
1105 1110 1115 

CAT GTC GCT GGG GTG AGC ATG TTT TTT AAA GGC AGA GAA GAT TTA AGA 33 6 

His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
1120 1125 1130 

TTA ACG CTT TTA AGG GAT AAC AAT ACG ATT AAG CTA GTG GAA AAT CCG 3 84 

Leu Thr Leu Leu Arg Asp Asn Asn Thr lie Lys Leu Val Glu Asn Pro 
1135 1140 1145 

TCA TTA GAG AAT AGC CCT TTA GCG CAA AAA GCG ATG AAA AAT AAA GAA 432 
Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 
1150 1155 1160 1165 



9, 



ATT TCT AAA AGT TTG GGT TAT TAT AGG AAA ATG CCT AAT GGG GCG GAA 480 
lie Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 
1170 1175 1180 




T TAT GGG GTG GAT ATT CTT TTA CCT TTA TTG AAT GAG AAC GCT CAA 528 
al Tyr Gly Val Asp He Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 
1185 1190 1195 

GAG GTT GTA GGG GCT TTG ATG ATT TTT ATT TCC ATT GAC AGC TTC AGC 576 
Glu Val Val Gly Ala Leu Met He Phe He Ser He Asp Ser Phe Ser 
1200 1205 1210 

AAT GAA ATC ACT AAA AAC AGG AGC GAT TTA TTT TTA ATT GGC ACT AAA 624 
Asn Glu He Thr Lys Asn Arg Ser Asp Leu Phe Leu lie Gly Thr Lys 
1215 1220 1225 

GGT AAA GTG CTT TTG AGC GCG AAT AAG AGT TTG CAA GAC AAA CCT ATC 672 
Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro He 
1230 1235 1240 1245 

GCA GAA ATT TAT AAG AGC GTG CCT AAA GCC ACC AAC GAA GTG ATG GCT 72 0 

Ala Glu He Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
1250 1255 1260 

ATT TTA GAA AAC GGC TCT AAA GCG ACT TTA GAA TAC TTA GAT CCC TTT 768 
~le Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
1265 1270 1275 

GO CAT AAG GAA AAT TTT TTA GCC GTT GAA ACC TTT AAA ATG CTA GGC 816 
Ser His Lys Glu Asn Phe Leu Ala Val Glu Thr Phe Lys Met Leu Gly 
1280 1285 1290 

AAA ACA GAA AGT AAA GAC AAT CTT AAT TGG ATG ATC GCT TTA ATC ATT 864 
Lys Thr Glu Ser Lys Asp Asn Leu Asn Trp Met lie Ala Leu He lie 
1295 1300 1305 

GAA AAA GAC AAG GTC TAT GAG CAA GTA GGC TCG GTG CGT TTT GTG GTG 912 
Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val 
!310 1315 1320 1325 

ATC ATA GCG AGC GCA ATC ATG GTG TTA GCC TTG ATT ATA GCG ATC ACT 960 
lie lie Ala Ser Ala He Met Val Leu Ala Leu He He Ala He Thr 
1330 1335 1340 
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CTC TTA ATG CGA GCG ATC GTG AGC AGT CGT TTG GAA GCC GTT TCT AGC 1008 
Leu Leu Met Arg Ala lie Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
1345 1350 1355 

ACC TTG TCT CAT TTC TTT AAA TTA TTG AAC AAT CAA GCC AAT TCT AGC 1056 
Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
1360 1365 1370 

GGT ATT AAA TTG ATT GAA GCG AAA TCC AAT GAC GAG TTA GGC CGC ATG 1104 
Gly lie Lys Leu lie Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
1375 1380 1385 

CAA ACA GCG ATC AAT AAA AAT ATC TTG CAA ACC CAA AAA ATC ATG CAA 1152 
Gin Thr Ala lie Asn Lys Asn lie Leu Gin Thr Gin Lys lie Met Gin 
1390 1395 1400 1405 

GAA GAC AGG CAA GCC GTC CAA GAC ACC ATT AAA GTG GTT TCA GAT GTG 1200 
Glu Asp Arg Gin Ala Val Gin Asp Thr lie Lys Val Val Ser Asp Val 
1410 1415 1420 



AAA GCA GGG AAT TTT GCG GTG CGC ATC ACG GCT GAG CCC GCA AGC CCT 1248 
s Ala Gly Asn Phe Ala Val Arg lie Thr Ala Glu Pro Ala Ser Pro 
1425 1430 1435 




GAT TTG AAA GAA TTG AGG GAC GCG CTA AAT GGG ATC ATG GAT TAT TTG 12 96 

Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly lie Met Asp Tyr Leu 
1440 1445 1450 

CAA GAA AGC GTA GGG ACT CAC ATG CCA AGC ATT TTC AAA ATC TTT GAA 1344 
Gin Glu Ser Val Gly Thr His Met Pro Ser lie Phe Lys lie Phe Glu 
1455 1460 1465 

AGC TAT TCT GGT TTG GAT TTT AGA GGC CGG ATC CAA AAC GCT TCG GGT 13 92 

Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg lie Gin Asn Ala Ser Gly 
1470 1475 1480 1485 

AGG GTG GAA CTG GTT ACT AAC GCT TTA GGG CAA GAA ATC CAA AAA ATG 144 0 

Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu lie Gin Lys Met 
1490 1495 1500 

CTA GAA ACT TCG TCT AAT TTT GCC AAA GAT TTA GCG AAC GAT AGC GCG 14 8 8 

Leu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 
1505 1510 1515 

VT TTA AAA GAG TGC GTG CAA AAT TTA GAA AAA GCT TCA AAC TCC CAA 1536 
sn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys Ala Ser Asn Ser Gin 
1520 1525 1530 

CAC AAA AGC TTG ATG GAA ACT TCC AAA ACG ATA GAA AAT ATC ACC ACT 1584 
His Lys Ser Leu Met Glu Thr Ser Lys Thr lie Glu Asn lie Thr Thr 
1535 1540 1545 

TCC ATT CAA GGC GTG AGC TCT CAA AGT GAA GCC ATG ATT GAA CAA GGG 1632 
Ser lie Gin Gly Val Ser Ser Gin Ser Glu Ala Met lie Glu Gin Gly 
!550 1555 1560 1565 

CAA GAC ATT AAA AGC ATT GTA GAA ATC ATT AGA GAT ATT GCT GAT CAA 1680 
Gin Asp lie Lys Ser lie Val Glu He He Arg Asp He Ala Asp Gin 
1570 .1575 1580 

ACC AAT CTT TTA GCC TTA AAC GCC GCT ATT GAA GCC GCA AGG GCC GGC 1728 
Thr Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 
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1585 1590 1595 

GAG CAT GGC AGA GGC TTT GCG GTG GTG GCT GAT GAG GTA AGA AAG CTC 1776 
Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
1600 1605 1610 

GCT GAA AGG ACG CAA AAA TCG CTC AGC GAG ATT GAA GCC AAT ATC AAT 1824 
Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu He Glu Ala Asn He Asn 
1615 1620 1625 

ATT TTA GTG CAA AGC ATT TCA GAC ACG AGC GAA AGC ATT AAA AAC CAG 1872 
He Leu Val Gin Ser lie Ser Asp Thr Ser Glu Ser He Lys Asn Gin 
1630 1635 1640 1645 

GTT AAA GAA GTG GAA GAA ATC AAC GCT TCT ATT GAA GCC TTA AGA TCG 1920 
Val Lys Glu Val Glu Glu He Asn Ala Ser He Glu Ala Leu Arg Ser 
1650 1655 1660 

GTT ACT GAG GGC AAT CTA AAA ATC GCT AGC GAT TCT TTA GAA ATC AGT 1968 
Val Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
1665 1670 1675 

\A GAA ATT GAC AAA GTT TCT AAC GAT ATT TTA GAA GAT GTG AAT AAA 2016 
In Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
1680 1685 1690 

AAG CAG TTT TAA 2028 
Lys Gin Phe * 
1695 

(2) ANGABEN ZU SEQ ID NO: 104: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 676 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 104: 

Leu Ser Lys Gly Leu Ser He Gly Asn Lys He He Leu Cys Val Ala 
15 10 15 

u He Val He Val Cys Val Ser He Leu Gly Val Ser Leu Asn Ser 
20 25 30 

Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
35 40 45 

Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
50 55 60 

Tyr Thr Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
65 70 75 80 

Arg Glu He Lys He Gly Leu Leu Lys Asn Phe He Leu Ala Asn Ser 
85 90 95 

His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
100 105 110 
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Leu Thr Leu Leu Arg Asp Asn Asn Thr lie Lys Leu Val Glu Asn Pro 
115 120 125 

Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 
130 135 140 

lie Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 
145 150 155 160 

Val Tyr Gly Val Asp lie Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 
165 170 175 

Glu Val Val Gly Ala Leu Met lie Phe lie Ser lie Asp Ser Phe Ser 
180 185 190 

Asn Glu lie Thr Lys Asn Arg Ser Asp Leu Phe Leu lie Gly Thr Lys 
195 200 205 

Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro lie 
210 215 220 

a Glu lie Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
5 230 235 240 

lie Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
245 250 255 

Ser His Lys Glu Asn Phe Leu Ala Val Glu Thr Phe Lys Met Leu Gly 
260 265 270 

Lys Thr Glu Ser Lys Asp Asn Leu Asn Trp Met lie Ala Leu lie lie 
275 280 285 

Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val 
290 295 300 

lie lie Ala Ser Ala lie Met Val Leu Ala Leu lie lie Ala lie Thr 
305 310 315 320 

Leu Leu Met Arg Ala lie Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
325 330 335 

Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
340 345 350 

y lie Lys Leu lie Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
355 360 365 

Gin Thr Ala lie Asn Lys Asn lie Leu Gin Thr Gin Lys lie Met Gin 
370 375 380 

Glu Asp Arg Gin Ala Val Gin Asp Thr lie Lys Val Val Ser Asp Val 
3 85 390 395 400 

Lys Ala Gly Asn Phe Ala Val Arg lie Thr Ala Glu Pro Ala Ser Pro 
405 410 415 

Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly lie Met Asp Tyr Leu 
420 425 430 

Gin Glu Ser Val Gly Thr His Met Pro Ser He Phe Lys He Phe Glu 
435 440 445 
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Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg lie Gin Asn Ala Ser Gly 

450 455 460 

Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu lie Gin Lys Met 

465 470 475 480 

Leu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 

485 490 495 

Asn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys Ala Ser Asn Ser Gin 

500 505 510 

His Lys Ser Leu Met Glu Thr Ser Lys Thr He Glu Asn He Thr Thr 

515 520 525 

Ser He Gin Gly Val Ser Ser Gin Ser Glu Ala Met He Glu Gin Gly 

530 535 540 

Gin Asp He Lys Ser lie Val Glu He He Arg Asp He Ala Asp Gin 

545 550 555 560 

r Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 



Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
580 585 590 

Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu He Glu Ala Asn He Asn 
595 600 605 

He Leu Val Gin Ser He Ser Asp Thr Ser Glu Ser He Lys Asn Gin 
610 615 620 

Val Lys Glu Val Glu Glu He Asn Ala Ser He Glu Ala Leu Arg Ser 
625 630 635 640 

Val Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
645 650 655 

Gin Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
660 665 670 

Lys Gin Phe * 



565 



570 



575 




) ANGABEN ZU SEQ ID NO: 105: 



675 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 273 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS161 



(ix) 



MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .273 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 105: 

GTG GCG GTG AAA AAA ATC GTT GTG AGT TGG TGT GTG GCG TTG GCT TTT 4 8 

Val Ala Val Lys Lys lie Val Val Ser Trp Cys Val Ala Leu Ala Phe 
680 685 690 

TTA AGC GCG GAT TCA GCA CAA GCC AAT AAA GCG ATC AGT AAT GCG GAT 96 
Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala He Ser Asn Ala Asp 
695 700 705 

TTG ATT AAA GAG ATA AGG GAT TTA AAA AAA ATC ATC AGC GCG CAA AAC 144 
Leu He Lys Glu He Arg Asp Leu Lys Lys He He Ser Ala Gin Asn 
710 715 720 

ACT GAG ATT AAC AAC TTA AGA AAA GTG CAA GAA GTG TTG TCT GGG CAA 192 
Thr Glu He Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
725 730 735 740 

TTA GGG GAC ATG CGT AAG GAT ATA TTA AGC ACT AGA GAT TAT TGC ATT 24 0 

Leu Gly Asp Met Arg Lys Asp He Leu Ser Thr Arg Asp Tyr Cys He 
745 750 755 

iGC TTA AGG CCT TAT ATC TAT AAT TGG CGC TAG 2 73 

er Leu Arg Pro Tyr lie Tyr Asn Trp Arg * 
760 765 




(2) ANGABEN ZU SEQ ID NO: 106: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 91 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 106: 

Val Ala Val Lys Lys He Val Val Ser Trp Cys Val Ala Leu Ala Phe 
1 5 10 15 

Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala He Ser Asn Ala Asp 
20 25 30 

■eu He Lys Glu He Arg Asp Leu Lys Lys He He Ser Ala Gin Asn 
k 35 40 45 

'hr Glu He Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
50 55 60 

Leu Gly Asp Met Arg Lys Asp He Leu Ser Thr Arg Asp Tyr Cys He 
65 70 75 80 

Ser Leu Arg Pro Tyr He Tyr Asn Trp Arg * 
85 90 

(2) ANGABEN ZU SEQ ID NO: 107: 

( i ) S E QUENZ KENNZ EI CHEN : 

(A) LANGE: 759 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 
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(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS176 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .759 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 107: 

ATG TTA GGG AAA AAA AAC GAA GAA GTC TTG ATT GAT GAA AAT TTG GTT 4 8 

Met Leu Gly Lys Lys Asn Glu Glu Val Leu lie Asp Glu Asn Leu Val 
95 100 105 

GGG GGT GTG ATA GCC CTT GAT AGA TTG GCA AAA CTC AAT AAG GCC AAT 96 
Gly Gly Val lie Ala Leu Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn 
110 115 120 

£GG ACT TTC AAA AGG GCT TTT TAT CTC TCT ATG GCA CTC AAT GTC GCC 144 
rg Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Ala Leu Asn Val Ala 
125 130 135 

GCT GTA ACG AGT ATT GTG ATG ATG ATG CCT TTG AAG AAA ACG GAT ATA 192 
Ala Val Thr Ser lie Val Met Met Met Pro Leu Lys Lys Thr Asp lie 
140 145 150 155 

TTT GTT TAT GGC ATT GAT CGA TAC ACA GGA GAA TTT AAA ATT GTC AAA 24 0 

Phe Val Tyr Gly lie Asp Arg Tyr Thr Gly Glu Phe Lys He Val Lys 
160 165 170 

CGC TCC GAT GCT AGG CAA ATC GTC AAT TCT GAA GCC GTT GTG GAT AGT 2 88 

Arg Ser Asp Ala Arg Gin He Val Asn Ser Glu Ala Val Val Asp Ser 
175 180 185 

GCA ACT TCA AAA TTT GTA TCA TTG CTG TTT GGT TAT AGC AAA AAT TCT 336 
Ala Thr Ser Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys Asn Ser 
190 195 200 

TTG AGG GAT CGC AAG GAT CAA CTA ATG CAG TAT TGC GAT GTG AGT TTC 384 
Leu Arg Asp Arg Lys Asp Gin Leu Met Gin Tyr Cys Asp Val Ser Phe 
205 210 215 



ACC CAA GCA ATG AGA ATG TTC AAT GAA AAT ATC AGA CAA TTC GTA 432 
n Thr Gin Ala Met Arg Met Phe Asn Glu Asn He Arg Gin Phe Val 
'220 225 230 235 

GAT AAA GTC CGA GCA GAA GCT ATC ATT AGC TCT AAC ATA CAA AGA GAA 480 
Asp Lys Val Arg Ala Glu Ala He He Ser Ser Asn He Gin Arg Glu 
240 245 250 

AAA GTC AAA AAT AGT CCC TTA ACG AGA TTA ACA TTT TTC ATT ACC ATC 528 
Lys Val Lys Asn Ser Pro Leu Thr Arg Leu Thr Phe Phe He Thr He 
255 260 265 

AAA ATC ACA CCT GAT ACA ATG GAA AAT TAT GAA TAT ATC ACT AAA AAA 576 
Lys He Thr Pro Asp Thr Met Glu Asn Tyr Glu Tyr He Thr Lys Lys 
270 275 280 

CAA GTA ACT ATT TAT TAT GAT TTT GCT AGA GGT AAC TCT TCT CAA GAA 624 
Gin Val Thr He Tyr Tyr Asp Phe Ala Arg Gly Asn Ser Ser Gin Glu 
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285 290 295 

AAT CTT ATC ATC AAT CCT TTT GGC TTC AAA GTG TTT GAC ATT CAA ATC 672 
Asn Leu lie lie Asn Pro Phe Gly Phe Lys Val Phe Asp lie Gin lie 
300 305 310 315 

ACA GAT TTA CAA AAC GAA CAG ACG GTA AGC GAA ATT TTG AGA AAG ATC 720 
Thr Asp Leu Gin Asn Glu Gin Thr Val Ser Glu lie Leu Arg Lys He 
320 325 330 

AGA GAA GTG GAA TCA AAA AAT AAG GCA TTA AAT AAA TAA 75 9 

Arg Glu Val Glu Ser Lys Asn Lys Ala Leu Asn Lys * 
335 340 

(2) ANGABEN ZU SEQ ID NO: 108: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 253 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKXJLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 108: 

Met Leu Gly Lys Lys Asn Glu Glu Val Leu He Asp Glu Asn Leu Val 
15 10 15 

Gly Gly Val He Ala Leu Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn 
20 25 30 

Arg Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Ala Leu Asn Val Ala 
35 40 45 

Ala Val Thr Ser He Val Met Met Met Pro Leu Lys Lys Thr Asp He 
50 55 60 

Phe Val Tyr Gly He Asp Arg Tyr Thr Gly Glu Phe Lys He Val Lys 
65 70 75 80 

Arg Ser Asp Ala Arg Gin He Val Asn Ser Glu Ala Val Val Asp Ser 

85 90 95 



^la Thr Ser Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys Asn Ser 
100 105 110 



eu Arg Asp Arg Lys Asp Gin Leu Met Gin Tyr Cys Asp Val Ser Phe 
115 120 125 

Gin Thr Gin Ala Met Arg Met Phe Asn Glu Asn He Arg Gin Phe Val 
130 135 140 

Asp Lys Val Arg Ala Glu Ala He He Ser Ser Asn He Gin Arg Glu 
145 150 155 160 

Lys Val Lys Asn Ser Pro Leu Thr Arg Leu Thr Phe Phe He Thr He 
165 170 175 

Lys He Thr Pro Asp Thr Met Glu Asn Tyr Glu Tyr He Thr Lys Lys 
180 185 190 

Gin Val Thr He Tyr Tyr Asp Phe Ala Arg Gly Asn Ser Ser Gin Glu 



195 200 

Asn Leu lie lie Asn Pro Phe Gly Phe 
210 215 

Thr Asp Leu Gin Asn Glu Gin Thr Val 
225 230 

Arg Glu Val Glu Ser Lys Asn Lys Ala 
245 

(2) ANGABEN ZU SEQ ID NO: 109: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1245 Basenpaare 
<B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 
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205 

Lys Val Phe Asp lie Gin lie 
220 

Ser Glu lie Leu Arg Lys lie 
235 240 

Leu Asn Lys * 
250 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS187 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1245 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 10 9: 

ATG GAG AAA GGA GTT TGG AAT ATG CTT GAC ATA TGG ATA GAT ATG ATA 4 8 

Met Glu Lys Gly Val Trp Asn Met Leu Asp lie Trp He Asp Met He 
255 260 265 

ATT TGT ATT TTT TAT TTG CTC TTT TTT ACG ACT CCT TAC ATT GTA GGC 96 
He Cys He Phe Tyr Leu Leu Phe Phe Thr Thr Pro Tyr He Val Gly 
270 275 280 285 

GAT ATT TTG CAA TTG AAA TTT ATC CGC CAA AAG CTC TGC GAA AAA CCT 144 
Asp He Leu Gin Leu Lys Phe He Arg Gin Lys Leu Cys Glu Lys Pro 
290 295 300 



OF 



[TT TTA CTC CCA CAA AAG GAT TAT GAA GAA GCG GGA AAT TAT GCC ATT 192 
1 Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn Tyr Ala He 
305 310 315 



AGG AAA ATG CAA TTA TCC ATT ATT TCT CAA ATT TTA GAC GGG ATA ATC 24 0 

Arg Lys Met Gin Leu Ser He He Ser Gin He Leu Asp Gly He He 
320 325 330 

TTT GCT GGG TGG GTC TTT TTT GGT TTG ACG CAT TTA GAA GAT CTC ACG 2 88 

Phe Ala Gly Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr 
335 340 345 

CAT TAT TTA AAC CTT CCT GAA ACG CTA GGT TAC TTG GTG TTT GCC TTG 33 6 

His Tyr Leu Asn Leu Pro Glu Thr Leu Gly Tyr Leu Val Phe Ala Leu 
350 355 360 365 

TTG TTT TTA GCG ATT CAA AGC GTT TTA GCT TTA CCC ATT AGC TAC TAC 3 84 

Leu Phe Leu Ala He Gin -Ser Val Leu Ala Leu Pro He Ser Tyr Tyr 
370 375 380 
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ACC ACG ATG CAT TTG GAT AAG GAA TTT GGC TTT TCT AAG GTG AGC TTG 43 2 

Thr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
385 390 395 

TCG TTG TTT TTT AAG GAT TTT TTC AAA GGG TTA TCG CTC ACT TTA AGC 4 80 

Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 
400 405 410 

GTG GGG TTG TTG TTG ATT TAC ACT CTC ATT ATG ATC ATT GAA CAT GTG 528 
Val Gly Leu Leu Leu lie Tyr Thr Leu lie Met lie lie Glu His Val 
415 420 425 

GAA CAT TGG GAG ATT AGC TCG TTT TTT GTC GTG TTT GTT TTT ATG ATC 576 
Glu His Trp Glu lie Ser Ser Phe Phe Val Val Phe Val Phe Met lie 
430 435 440 445 

TTG GCT AAT CTT TTT TAC CCT AAA ATC GCT CAG CTT TTC AAC CAA TTC 624 
Leu Ala Asn Leu Phe Tyr Pro Lys lie Ala Gin Leu Phe Asn Gin Phe 
450 455 460 

ACC CCC TTG AAC AAT AGG GAT TTA GAG AGT CAA ATT GAG GGC ATG ATG 672 
lir Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin lie Glu Gly Met Met 
465 470 475 

GAT AAG GTG GGT TTT AAA TCT GAA GGT ATC TTT GTG ATG GAC GCT AGC 720 
Asp Lys Val Gly Phe Lys Ser Glu Gly lie Phe Val Met Asp Ala Ser 
480 485 490 

AAG AGG GAC GGG CGT TTG AAC GCG TAT TTT GGA GGC TTG GGT AAA AAC 768 
Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
495 500 505 

AAG CGG GTG GTG TTG TTT GAC ACT TTG ATC TCT AAA GTT GGG ACA GAA 816 
Lys Arg Val Val Leu Phe Asp Thr Leu lie Ser Lys Val Gly Thr Glu 
510 515 520 525 

GGG CTT TTA GCC ATT TTA GGG CAT GAA TTA GGG CAT TTT AAA AAT AAG 864 
Gly Leu Leu Ala lie Leu Gly His Glu Leu Gly His Phe Lys Asn Lys 
530 535 540 

GAT TTG TTG AAA AGT TTA GGG ATT ATG GGA GGC TTA CTC GCT CTT GTT 912 
Asp Leu Leu Lys Ser Leu Gly lie Met Gly Gly Leu Leu Ala Leu Val 
545 550 555 



T GCT CTG ATC GCT CAT TTG CCG CCG TTG GTT TTT GAA GGC TTC AAT 960 
e Ala Leu lie Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
560 565 570 



GTC TCA CAA ACG CCA GCG AGT TTG ATT GCG ATT TTA CTC TTG TTT TTG 100 8 

Val Ser Gin Thr Pro Ala Ser Leu lie Ala lie Leu Leu Leu Phe Leu 
575 580 585 

CCG GTA TTT TCT TTT TAC GCT ATG CCT TTG ATC GGG TTT TTT AGC CGA 1056 
Pro Val Phe Ser Phe Tyr Ala Met Pro Leu lie Gly Phe Phe Ser Arg 
590 595 600 605 

AAG AAT GAA TAC AAT GCA GAC AAG TTT GGG GCG AGT TTA AGC TCT AAA 1104 
Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
610 615 620 

GAG GTT TTA GCC AAA GCG TTA GTG TCT ATT GTG AGT GAG AAT AAA GCG 1152 
Glu Val Leu Ala Lys Ala Leu Val Ser He Val Ser Glu Asn Lys Ala 
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625 630 635 

TTC CCC TAT TCG CAC CCT TTT TAT GTT TTC TTG CAT TTC ACG CAC CCG 1200 

Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
640 645 650 

CCC TTA TTA GAG CGC TTG AAA GCT TTG GAT TAT GAA ATT GAA TGA 1245 

Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu lie Glu * 
655 660 665 



(2) ANGABEN ZU SEQ ID NO: 110: 

( i ) SEQTJENZKENNZEICHEN : 

(A) LANGE: 415 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 110: 

et Glu Lys Gly Val Trp Asn Met Leu Asp lie Trp lie Asp Met lie 
15 10 15 

lie Cys lie Phe Tyr Leu Leu Phe Phe Thr Thr Pro Tyr lie Val Gly 
20 25 30 

Asp lie Leu Gin Leu Lys Phe lie Arg Gin Lys Leu Cys Glu Lys Pro 
35 40 45 

Val Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn Tyr Ala lie 
50 55 60 

Arg Lys Met Gin Leu Ser lie lie Ser Gin lie Leu Asp Gly lie lie 
65 70 75 80 

Phe Ala Gly Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr 
85 90 95 

His Tyr Leu Asn Leu Pro Glu Thr Leu Gly Tyr Leu Val Phe Ala Leu 
100 105 110 



Leu Phe Leu Ala lie Gin Ser Val Leu Ala Leu Pro lie Ser Tyr Tyr 
115 120 125 



r Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
130 135 140 

Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 
145 150 155 160 

Val Gly Leu Leu Leu lie Tyr Thr Leu lie Met lie lie Glu His Val 
165 170 175 

Glu His Trp Glu lie Ser Ser Phe Phe Val Val Phe Val Phe Met lie 
180 185 190 

Leu Ala Asn Leu Phe Tyr Pro Lys lie Ala Gin Leu Phe Asn Gin Phe 
195 200 205 

Thr Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin lie Glu Gly Met Met 
210 215 220 
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Asp Lys Val Gly Phe Lys Ser Glu Gly lie Phe Val Met Asp Ala Ser 
225 230 235 240 

Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
245 250 255 

Lys Arg Val Val Leu Phe Asp Thr Leu lie Ser Lys Val Gly Thr Glu 
260 265 270 

Gly Leu Leu Ala lie Leu Gly His Glu Leu Gly His Phe Lys Asn Lys 
275 280 285 

Asp Leu Leu Lys Ser Leu Gly lie Met Gly Gly Leu Leu Ala Leu Val 
290 . 295 300 

Phe Ala Leu lie Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
305 310 315 320 

Val Ser Gin Thr Pro Ala Ser Leu lie Ala lie Leu Leu Leu Phe Leu 
325 330 335 

ro Val Phe Ser Phe Tyr Ala Met Pro Leu lie Gly Phe Phe Ser Arg 
340 345 350 

Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
355 360 365 

Glu Val Leu Ala Lys Ala Leu Val Ser lie Val Ser Glu Asn Lys Ala 
370 375 380 

Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
385 390 395 400 

Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu lie Glu * 
405 410 415 

(2) ANGABEN ZU SEQ ID NO: 111: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1566 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS189 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1566 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 111: 

ATG AAA AAC ATT TAT CTT GAT GTG AAA GCC AGC ATT GAA AAT CTC CAA 48 
Met Lys Asn lie Tyr Leu Asp Val Lys Ala Ser lie Glu Asn Leu Gin 
420 425 430 



AAT ATT TTT AAA AAC ACT GAT AAT GAA AAT GAA AGA CTA AAA AAA TTC 
Asn lie Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 



96 
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435 440 445 

AAC CAA GAA GCG TTG GAG GTG TTT CAA AAA TTA GAG CGT GAA AGT TTA 144 
Asn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
450 455 460 

AAA GAG CTT GAA AGC TTA AAA AAT AAT GAG GAG TGG GAA AAT TTT ACT 192 
Lys Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 
465 470 475 

ATC GCT TTT TAT GGG GAA ACC GGT GCG GGG AAA TCA ACC TTC ATT GAA 240 
lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe lie Glu 
480 485 490 495 

TGT TTG AGA ATG TTT TTT AAA GAA CAA AGT AAA GTA GTT' CAA CAA GAA 288 
Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 
500 505 510 

CGA TTC AAG CGG CTT TAT TCC AAT TAC CAA AAC AAC TAT CAA AAT GAT 33 6 

Arg Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
515 520 525 

AA TGC AAA AAG CAA GCT ATT TTA AAC GAA CTT CAT TCA TTG CAA GAT 3 84 

lu Cys Lys Lys Gin Ala lie Leu Asn Glu Leu His Ser Leu Gin Asp 
530 535 540 

GGA GCG ATC ATA GGC GAT GGG AGG AGC GAT TTC ACT TTA AAA ACA CGA 432 
Gly Ala lie lie Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
545 550 555 

TCT TAT TCT TTC CAA TAC AAC CAT CAA AAC TTT ACT TTG CTT GAT GTT 4 80 

Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
560 565 570 575 

CCA GGG ATA GAA GGC GAC GAA AAA AAA GTG ATC GAT CAG ATT TCT AAC 52 8 

Pro Gly lie Glu Gly Asp Glu Lys Lys Val He Asp Gin He Ser Asn 
580 585 590 

GCA ACG CAA AAA GCC CAT GCT ATT TTT TAT GTT ACC AAA ACG CCT AAT 576 
Ala Thr Gin Lys Ala His Ala He Phe Tyr Val Thr Lys Thr Pro Asn 
595 600 605 

CCT CCG CAA AAA GGA GAA GAG AAA AAA GAA GGG ACG ATT GAA AAA ATC 624 
ro Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr He Glu Lys He 
610 615 620 

!AA AAA CAA CTT GAT TCG CAA ACA GAG GTA TGG ACG ATT TTT AAC AAA 672 
Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
625 630 635 

CCG ATT AAC AAC CCA AGA GCT TTC AAA GAT GGG CTT ATT GAT GGA AGC 72 0 

Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
640 645 650 655 

GAA AAA GAA AGC TTA AAA ATT TTA AAT AAA GAA ATG AAA AAC ATT TTA 768 
Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn He Leu 
660 665 670 

GGC AAA CAC TAC AAG GGC TAT AAA GCA GTG AGC GCC CAA GTG GCT TTT 816 
Gly Lys His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
675 680 685 
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TAT GGT CTT TCA TCG GCT TTG ATC CCA GGG ACT GAT TTT GAT AAA AAC 864 
Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
690 695 700 

AAA CAA AAA TTT TTA AAA GAT TTT AAA GCA AGA GAA TTA TTG TAT CAA 912 
Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
705 710 715 

TCC CAT TTC CAA CAA TTA GGA GAA TTT ATA GCC GAA GAG CTT ATT AAA 960 
Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu He Lys 
720 725 730 735 

AAC TCG CGT GCC AAA ATC ATT CAA TCA AAC TGC AAT AAA GCC TTA AAA 1008 
Asn Ser Arg Ala Lys He He Gin Ser Asn Cys Asn Lys Ala Leu Lys 
740 745 750 

GTG GTA GAA CAA TTG CAA AAG GCG ATC GAA ATT ACG ATT GAA AAA CGG 1056 
Val Val Glu Gin Leu Gin Lys Ala He Glu He Thr He Glu Lys Arg 
755 760 765 



£TC GAT CCA ATG ATT AAA GAA GCA CAA GAA TAC CAA CAC GAA GCC CGC 1104 
"e Asp Pro Met He Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
770 775 780 



TAT AAT CTG GAT CGT TCT ACA GAT AAA TTT ATA TTA AAT TTA ACC AAT 1152 
Tyr Asn Leu Asp Arg Ser Thr Asp Lys Phe He Leu Asn Leu Thr Asn 
785 790 795 

TCA GCG TTC TAC GAA ATC GAT CAA TTC AAA TCT GAC TTG AGA GAA AAA 1200 
Ser Ala Phe Tyr Glu He Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
800 805 810 815 

ATG TAT GCG CAT ATT AAC AAA AAT ATT GAA GAT GAG GAA TGT AAA GAA 1248 
Met Tyr Ala His He Asn Lys Asn He Glu Asp Glu Glu Cys Lys Glu 
820 825 830 

ATT TTT AAA AAT GAA CTC ATT CAA GGA ATT GAA ACA TTG CAT GAA GAC 1296 
He Phe Lys Asn Glu Leu He Gin Gly He Glu Thr Leu His Glu Asp 
835 840 845 

ATA AAA TGG CGG TTT AGA GAA TGT GAG AAA CGA TTT GAT GGA GAG ATA 1344 
He Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu He 
850 855 860 



GAA GCT ATT AAA CAA CTT GAA TAC AGA ATT AAA GAT TCT CTA GCA 13 92 

s Glu Ala He Lys Gin Leu Glu Tyr Arg He Lys Asp Ser Leu Ala 
865 870 875 



ATG TTA GAG CGC ATC AGT ATT GAT AGA GAC TTT AAT CTT AAT TTT GAT 1440 
Met Leu Glu Arg He Ser He Asp Arg Asp Phe Asn Leu Asn Phe Asp 
880 885 890 895 

ACT GAT AGC GGT ATT GAT GGA ACA AAA TTA GCC ACT TCA ATA GGA GGT 14 88 

Thr Asp Ser Gly He Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
900 905 910 

TTG GGT TTG CTT GGG ATA TTT AAC GCT TGG AAT CCT ATG GGT TGG CTT 153 6 

Leu Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
915 920 925 

GCT CTG ACC GCA GGA TTA TTG CAG GAT TAG 1566 
Ala Leu Thr Ala Gly Leu Leu Gin Asp * 



930 



935 



(2) ANGABEN ZU SEQ ID NO: 112: 

( i ) SEQUENZ KENNZE I CHEN : 

(A) LANGE: 522 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 112: 

Met Lys Asn lie Tyr Leu Asp Val Lys Ala Ser lie Glu Asn Leu Gin 
1 5 10 15 

Asn lie Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 
20 25 30 

Asn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
35 40 45 

rs Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 
50 55 60 

lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe lie Glu 
65 70 75 80 

Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 
85 90 95 

Arg Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
'100 105 110 

Glu Cys Lys Lys Gin Ala He Leu Asn Glu Leu His Ser Leu Gin Asp 
115 120 125 

Gly Ala lie He Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
130 135 140 

Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
14 5 150 155 160 



ro Gly He Glu Gly Asp Glu Lys Lys Val He Asp Gin He Ser Asn 
165 170 175 



la Thr Gin Lys Ala His Ala He Phe Tyr Val Thr Lys Thr Pro Asn 
180 185 190 

Pro Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr lie Glu Lys He 
195 200 205 

Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
210 215 220 

Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
225 230 235 240 

Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn lie Leu 
245 250 255 

Gly Lys His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
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260 265 270 

Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
275 280 285 

Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
290 295 300 

Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu lie Lys 
305 310 315 320 

Asn Ser Arg Ala Lys lie lie Gin Ser Asn Cys Asn Lys Ala Leu Lys 
325 330 335 

Val Val Glu Gin Leu Gin Lys Ala lie Glu lie Thr lie Glu Lys Arg 
340 345 350 

lie Asp Pro Met lie Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
355 360 365 

Tyr Asn Leu Asp Arg Ser Thr Asp Lys Phe lie Leu Asn Leu Thr Asn 
370 375 380 

er Ala Phe Tyr Glu lie Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
385 390 395 400 

Met Tyr Ala His lie Asn Lys Asn lie Glu Asp Glu Glu Cys Lys Glu 
405 410 415 

lie Phe Lys Asn Glu Leu lie Gin Gly lie Glu Thr Leu His Glu Asp 
420 425 430 

lie Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu lie 
435 440 445 

Lys Glu Ala lie Lys Gin Leu Glu Tyr Arg lie Lys Asp Ser Leu Ala 
450 455 460 

Met Leu Glu Arg lie Ser lie Asp Arg Asp Phe Asn Leu Asn Phe Asp 
465 470 475 480 

Thr Asp Ser Gly lie Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
485 490 495 

u Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
500 505 510 

Ala Leu Thr Ala Gly Leu Leu Gin Asp * 
515 520 

(2) ANGABEN ZU SEQ ID NO: 113: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1782 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS191 
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(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .17 82 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 113: 

ATG AAA GCT ATA AAA ATA CTT TTT ATA ATG ACA CTC AGT TTA AAC GCT 48 

Met Lys Ala lie Lys lie Leu Phe lie Met Thr Leu Ser Leu Asn Ala 
525 530 535 

ATC AGC GTG AAT AGG GCG TTG TTT GAT TTA AAA GAT TCG CAA TTA AAA 96 

lie Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
540 545 550 

GGG GAA TTA ACG CCA AAA ATA GTG AAT TTT GGG GGT TAT AAA AGC AGC 144 

Gly Glu Leu Thr Pro Lys He Val Asn Phe Gly Gly Tyr Lys Ser Ser 
555 560 565 570 



ACT GAA GAG TGG GGG GCT ACG GCT TTA AAC TAT ATC AAT GCG GCT AAT 192 
hr Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr He Asn Ala Ala Asn 
575 580 585 



__C GAT GCG AAA AAA TTC AGC ACT CTA GTG GAA AAA ATG CGT TTT AAC 240 
Gly Asp Ala Lys Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
590 595 600 

TCC GGT ATA TTG GGG AAT TTA AGA GTG CAT GCA CGT TTG AGG CAA GCC 28 8 

Ser Gly He Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 
605 610 615 

CTA AAA TTG CAA AAG AAT TTG AAA TAT TGC CTT AAA ATC ATC GCT AGG 336 
Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys He He Ala Arg 
620 625 630 

GAT TCT TTT TAT AGC TAC CGC ACC GGT ATT TAT ATC CCC TTA GGC ATT 3 84 

Asp Ser Phe Tyr Ser Tyr Arg Thr Gly He Tyr He Pro Leu Gly He 
635 640 645 650 



TCT TTA AAA GAT CAA AAA ACG GCT CAA AAA ATG CTC GCT GAT TTG AGC 4 32 

Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
655 660 665 



[TG GTA GGG GCG TAT CTT AAA AAA CAA CAA GAG AAT GAA AAG GCT CAA 480 
1 Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
670 675 680 



AGC CCT TAT TAC AGA AAC AAC AAC TAT TAC AAC TCT TAC TAT AGC CCT 528 
Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
685 690 695 

TAT TAC GGA ATG TAT GGT ATG TAT GGC ATG GGC ATG TAT GGA ATG TAT 576 
Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
700 705 710 

GGC ATG GGC ATG TAT GAT TTT TAT GAC TTT TAT GAT GGC ATG TAT GGA 624 
Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
715 720 725 730 

TTC TAC CCT AAC ATG TTT TTC ATG ATG CAA GTT CAA GAT TAC TTG ATG 672 
Phe Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
735 740 745 
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TTA GAA AAT TAC ATG TAT GCG CTC GAT CAA GAA GAG ATT TTA GAT CAT 720 
Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu lie Leu Asp His 
750 755 760 

GAC GCT TCT ACT GAC CAA CTT GAT ACG CCT ACT GAT GAT GAC AAA GAC 768 

Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
765 770 775 

GAT AAA GAC GAT AAA TCC TTA CAG CAG GCA AAT CTT ATG AAC TTT TAT 816 

Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
780 785 790 

CGT GAT CCC AAA TTC AGC AAA GGC ATT CAA ACC AAC CGC TTG AAT AGC 8 64 

Arg Asp Pro Lys Phe Ser Lys Gly He Gin Thr Asn Arg Leu Asn Ser 
795 800 805 810 



_ TTi 

m 



GCT TTA GTC AAT TTA GAC AAC AGT CGC ATG CTC AAA GAC AAT TCG CTT 912 
Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
815 820 825 



TTC CAC ACT AAA GCC ATG CCC ACT AAA AGC GTG GAT GCG ATA ACT TCT 960 
^ e His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala He Thr Ser 
830 835 840 



CAA GCC AAA GAG CTT AAC CAT TTA GTG GGG CAA ATC AAA GAA ATG AAG 1008 
Gin Ala Lys Glu Leu Asn His Leu Val Gly Gin He Lys Glu Met Lys 
845 850 855 

CAA GAC GGG GCG AGT CCT AGT AAG ATT GAT TCA GTT GTC AAT AAA GCT 1056 
Gin Asp Gly Ala Ser Pro Ser Lys He Asp Ser Val Val Asn Lys Ala 
860 865 870 

ATG GAA GTG AGG GAC AAG CTA GAC AAT AAT CTC AAC CAA CTA GAC AAT 1104 
Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 
875 880 885 890 

GAC TTA AAA GAT CAA AAA GGG CTT TCA AGC GAG CAA CAA GCT CAA GTG 1152 
Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 
895 900 905 

GAT AAA GCC CTA GAC AGC GTG CAA CAA TTA AGC CAT AGC AGC GAT GTG 1200 
Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
910 915 920 

G GGG AAT TAT TTA GAC GGG AGT TTG AAA ATT GAT GGC GAT GAT AGA 1248 
1 Gly Asn Tyr Leu Asp Gly Ser Leu Lys He Asp Gly Asp Asp Arg 
925 930 935 

GAT GAT TTG AAT GAT GCG ATG AAT AAC CCT ATG CAA CAA CCC GTG CAA 1296 
Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
940 945 950 

CAA ACG CCT ACT AGC AAC ATG GCC GAC ACC CAT GCA AAT GAC AGC AAG 1344 
Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
955 960 965 970 

GAT CAA GGG AGT AAC GCG CTC ATA AAC CCT AAC AGC GCC ACT AAC GCC 1392 
Asp Gin Gly Ser Asn Ala Leu He Asn Pro Asn Ser Ala Thr Asn Ala 
975 980 985 

GAC GAC ACT CAC ACT GAC GAT ACT CAC ACT GAC ACT AAC ACC ACA AAC 144 0 

Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
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990 995 1000 

GAT GCT AGC ACC ACT GAC ACC CCC ACT GAC GAT AAA GAT GCT AGC GGC 148 8 

Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
1005 1010 1015 

TTG AAC AAT ACC GGC GAT ATG AAT AAC ACG GAT ACC GGC AAC ACG GAC 1536 
Leu Asn Asn Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
1020 1025 1030 

ACC GGC AAT ACG GAT ACC GGT AAC ACT GAT GAT ATG AGC AAC ATG AAC 1584 
Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Ash Met Asn 
1035 1040 1045 1050 

AAC GGC AAC GAT GAT ACG GGT AAC GCT AAT GAC GAC ATG AGC AAC GGC 1632 
Asn Gly Asn Asp Asp Thr Gly Asn Ala Asn Asp Asp Met Ser Asn Gly 
1055 1060 1065 



AA 

As: 



AAC GAC ATG GGC GAT GAT TTG AAC AAC GCG AAC GAT ^TG AAC GAC GAC 1680 
Asn Asp Met Gly Asp Asp Leu Asn Asn Ala Asn Asp *faet Asn Asp Asp 
1070 1075 1080 



G GGT AAT GGC AAC GAT GAC ATG GGC GAT ATG GGG GAT ATG AAC GAC 172 8 

et Gly Asn Gly Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp 
1085 1090 1095 

GAT ATG GGT GGC GAT ATG GGA GAC ATG GGG GAT ATG GGC GAT ATG GGG 1776 
Asp Met Gly Gly Asp Met Gly Asp Met Gly Asp Met Gly Asp Met Gly 
1100 1105 1110 

AAT TGA 1782 

Asn * 

1115 



(2) ANGABEN ZU SEQ ID NO: 114: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 594 Aminosauren 

(B) ART: Aminosaure 
<D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS: Protein 
(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 114: 

t Lys Ala lie Lys lie Leu Phe lie Met Thr Leu Ser Leu Asn Ala 
1 5 10 15 



lie Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
20 25 30 

Gly Glu Leu Thr Pro Lys lie Val Asn Phe Gly Gly Tyr Lys Ser Ser 
35 40 45 

Thr Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr lie Asn Ala Ala Asn 
50 55 60 

Gly Asp Ala Lys Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
65 70 75 80 



Ser Gly lie Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 
85 90 95 
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Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys lie lie Ala Arg 
100 105 110 

Asp Ser Phe Tyr Ser Tyr Arg Thr Gly He Tyr lie Pro Leu Gly He 
115 120 125 

Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
130 135 140 

Val Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
145 150 155 160 

Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
165 170 175 

Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
180 185 190 

Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
195 200 205 

he Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
21° 215 220 

Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu He Leu Asp His 
225 230 235 240 

Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
245 250 255 

Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
260 265 270 

Arg Asp Pro Lys Phe Ser Lys Gly He Gin Thr Asn Arg Leu Asn Ser 
275 280 285 

Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
290 295 300 

Phe His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala He Thr Ser 
305 310 315 320 

Gin Ala Lys Glu Leu Asn His Leu Val Gly Gin He Lys Glu Met Lys 
325 330 335 

n Asp Gly Ala Ser Pro Ser Lys He Asp Ser Val Val Asn Lys Ala 
340 345 350 

Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 
355 360 365 

Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 
370 375 380 

Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
385 390 395 400 

Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys He Asp Gly Asp Asp Arg 
405 410 415 

Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
420 425 430 
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Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
435 440 445 

Asp Gin Gly Ser Asn Ala Leu lie Asn Pro Asn Ser Ala Thr Asn Ala 
450 455 460 

Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
465 470 475 480 

Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
485 490 495 

Leu Asn Asn Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
500 505 510 

Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn 
515 520 525 

Asn Gly Asn Asp Asp Thr Gly Asn Ala Asn Asp Asp Met Set Asn Gly 
530 535 540 

sn Asp Met Gly Asp Asp Leu Asn Asn Ala Asn Asp Met Asn Asp Asp 
45 550 555 560 

Met Gly Asn Gly Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp 
565 570 575 

Asp Met Gly Gly Asp Met Gly Asp Met Gly Asp Met Gly Asp Met Gly 
580 585 590 

Asn * 



• 



1 




